本文介绍图像识别(imagerecog)类目下的元素识别DetectImageElements的语法及示例。
功能描述
元素识别能力用于识别输入图像中所包含的元素内容,用矩形框标注出其位置,并区分其对应的基本类型(人物、修饰、文案)。
- 输入原图 :
- 输出结果图 :
接入指引
1. 注册阿里云账号:打开阿里云官网,在阿里云官网右上角,单击立即注册,按照操作提示完成账号注册。
2. 开通能力:请确保您已开通图像识别服务,若未开通服务请立即开通。
3. 创建AccessKey:请确保您已创建AccessKey,如果您使用的是子账号AccessKey,您需要给子账号赋予AliyunVIAPIFullAccess权限,具体操作,请参见RAM授权。
4. 在线调试(可选):您可以通过OpenAPI Explorer在线调试能力,查看完整的调用示例代码及SDK依赖信息,也可以下载完整的工程。
5. 开发接入步骤:
- 在SDK总览中选择您要接入使用的SDK语言。
- 在对应语言的SDK文档中找到AI类目为图像识别(imagerecog)的SDK包进行安装。
- 参考文档中提供的示例代码进行适当修改后调用。
6. 示例代码:该能力常用语言的示例代码,请参见元素识别示例代码。
7. 客户端直接调用:该能力常用的客户端调用方式包括以下几种。
输入限制
- 图像格式:JPG、JPEG、BMP、PNG。
- 图像大小:不超过3 MB。
- 图像分辨率:不超过1280×1280像素。
- URL地址中不能包含中文字符。
计费说明
关于元素识别的计费方式及报价,请参见计费介绍。
调试
您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。
请求参数
名称 |
类型 |
是否必选 |
示例值 |
描述 |
Action | String | 是 | DetectImageElements | 系统规定参数。取值:DetectImageElements。 |
Url | String | 是 | http://viapi-test.oss-cn-shanghai.aliyuncs.com/viapi-3.0domepic/imagerecog/DetectImageElements/DetectImageElements5.jpg | 图像URL地址。推荐使用上海地域的OSS链接,对于文件在本地或者非上海地域OSS链接的情况,请参见文件URL处理。 |
返回数据
名称 |
类型 |
示例值 |
描述 |
RequestId | String | 7EE82437-AEC4-5AAF-819F-AB28C23EE0FC | 请求ID。 |
Data | Object | 返回的结果数据内容。 |
|
Elements | Array of Element | 元素列表。 |
|
Type | String | majorhuman | 元素类型。包括: UnType(未定义类型)、AllType(所有类型)、RootType(根类型)、Synthesis(组合元素图)、Embedded(所有嵌套类型)、Format(元素格式)、MajorObject(主体)、Character(文案)、Identifier(标识)、Background(背景)、Decoration(修饰)、MajorHuman(人物模特)、MajorAuction(商品)、MajorThing(物体)、MajorOther(其他主体)、CharMain(主文案)、CharSub(副文案)、CharAction(行动点文案)、CharContent(内容文案)、CharNumber(数字文案)、CharOther(其他文案)、IdentLogo(logo标识)、IdentLight(高亮标识)、IdentCode(码标识)、IdentOther(其他标识)、BackBitmap(位图背景)、BackVector(矢量图背景)、BackOther(其他背景)、DecoTile(平铺修饰)、DecoRegion(区域修饰)、DecoPieces(碎片修饰)、DecoEdge(贴边修饰)、DecoLine(线性修饰)、DecoBox(框型修饰)、DecoChar(行动点文案修饰)、DecoOther(其他修饰)、SynthMajor(主体组团)、SynthChar(文案组团)、SynthIdent(标识组团)、SynthBack(背景组团)、SynthDeco(修饰组团)、SynthOther(其他组团)、EmbedSvg(svg嵌套格式)、EmbedJson(JSON嵌套格式)、EmbedHtml(html嵌套格式)。 |
Width | Integer | 285 | 元素宽度。 |
Height | Integer | 354 | 元素高度。 |
Y | Integer | 78 | 元素左上角Y轴坐标。 |
Score | Float | 0.997097373008728 | 置信度,取值范围 |
X | Integer | 287 | 元素左上角X轴坐标。 |
SDK参考
阿里云视觉AI图像识别类目下的元素识别能力推荐使用SDK调用,支持多种编程语言,调用时请选择AI类目为图像识别(imagerecog)的SDK包,文件参数通过SDK调用可支持本地文件及任意URL,具体可参见SDK总览。
示例代码
该能力常用语言的示例代码,请参见元素识别示例代码。
示例
请求示例
http(s)://imagerecog.cn-shanghai.aliyuncs.com/?Action=DetectImageElements //更多关于访问域名(Endpoint)信息,请参见:https://help.aliyun.com/document_detail/143103.html
&Url=http://viapi-test.oss-cn-shanghai.aliyuncs.com/viapi-3.0domepic/imagerecog/DetectImageElements/DetectImageElements5.jpg
&<公共请求参数>
正常返回示例
XML
格式
HTTP/1.1 200 OK
Content-Type:application/xml
<DetectImageElementsResponse>
<RequestId>7EE82437-AEC4-5AAF-819F-AB28C23EE0FC</RequestId>
<Data>
<Elements>
<Type>character</Type>
<Score>0.999164342880249</Score>
<X>490</X>
<Y>215</Y>
<Height>66</Height>
<Width>380</Width>
</Elements>
<Elements>
<Type>character</Type>
<Score>0.998594701290131</Score>
<X>531</X>
<Y>302</Y>
<Height>38</Height>
<Width>308</Width>
</Elements>
<Elements>
<Type>majorauction</Type>
<Score>0.983854711055756</Score>
<X>51</X>
<Y>80</Y>
<Height>392</Height>
<Width>464</Width>
</Elements>
<Elements>
<Type>decoration</Type>
<Score>0.915460407733917</Score>
<X>596</X>
<Y>148</Y>
<Height>50</Height>
<Width>170</Width>
</Elements>
<Elements>
<Type>decoration</Type>
<Score>0.777607440948486</Score>
<X>649</X>
<Y>149</Y>
<Height>45</Height>
<Width>63</Width>
</Elements>
<Elements>
<Type>character</Type>
<Score>0.712217330932617</Score>
<X>533</X>
<Y>349</Y>
<Height>20</Height>
<Width>297</Width>
</Elements>
<Elements>
<Type>character</Type>
<Score>0.701746642589569</Score>
<X>239</X>
<Y>129</Y>
<Height>36</Height>
<Width>72</Width>
</Elements>
<Elements>
<Type>decoration</Type>
<Score>0.598963797092438</Score>
<X>594</X>
<Y>166</Y>
<Height>30</Height>
<Width>67</Width>
</Elements>
<Elements>
<Type>decoration</Type>
<Score>0.502112746238708</Score>
<X>703</X>
<Y>167</Y>
<Height>29</Height>
<Width>67</Width>
</Elements>
</Data>
</DetectImageElementsResponse>
JSON
格式
HTTP/1.1 200 OK
Content-Type:application/json
{
"RequestId" : "7EE82437-AEC4-5AAF-819F-AB28C23EE0FC",
"Data" : {
"Elements" : [ {
"Type" : "character",
"Score" : 0.999164342880249,
"X" : 490,
"Y" : 215,
"Height" : 66,
"Width" : 380
}, {
"Type" : "character",
"Score" : 0.998594701290131,
"X" : 531,
"Y" : 302,
"Height" : 38,
"Width" : 308
}, {
"Type" : "majorauction",
"Score" : 0.983854711055756,
"X" : 51,
"Y" : 80,
"Height" : 392,
"Width" : 464
}, {
"Type" : "decoration",
"Score" : 0.915460407733917,
"X" : 596,
"Y" : 148,
"Height" : 50,
"Width" : 170
}, {
"Type" : "decoration",
"Score" : 0.777607440948486,
"X" : 649,
"Y" : 149,
"Height" : 45,
"Width" : 63
}, {
"Type" : "character",
"Score" : 0.712217330932617,
"X" : 533,
"Y" : 349,
"Height" : 20,
"Width" : 297
}, {
"Type" : "character",
"Score" : 0.701746642589569,
"X" : 239,
"Y" : 129,
"Height" : 36,
"Width" : 72
}, {
"Type" : "decoration",
"Score" : 0.598963797092438,
"X" : 594,
"Y" : 166,
"Height" : 30,
"Width" : 67
}, {
"Type" : "decoration",
"Score" : 0.502112746238708,
"X" : 703,
"Y" : 167,
"Height" : 29,
"Width" : 67
} ]
}
}
错误码
关于元素识别的错误码,详情请参见常见错误码。
安全声明
- 请确保上传的图片或文件来源符合相应的法律法规。
- 通过体验调试上传的临时文件有效期为1小时,在24小时后会被系统自动清理删除。