如何使用视觉识别API获取图像上自定义对象的位置

9 浏览
0 Comments

如何使用视觉识别API获取图像上自定义对象的位置

我知道有很多视觉识别API,比如Clarifai、Watson、Google Cloud Vision、微软认知服务等都提供图像内容的识别。这些服务的响应是简单的json,包含不同的标签,比如

{ 
   man: 0.9969295263290405,
   portrait: 0.9949591159820557,
   face: 0.9261120557785034
}

问题在于,我不仅需要知道图像上有什么,还需要知道对象的位置。其中一些API具有这样的功能,但仅适用于面部检测。

所以,是否有人知道是否有这样的API,或者我需要针对每个对象在OpenCV上进行自己的haar级联训练。

感谢分享的任何信息。

admin 更改状态以发布 2023年5月21日
0
0 Comments

您可以看一下Wolfram Cloud / Mathematica。

它具有在图片中检测物体位置的功能。

一些示例。

0