元素识别

本文介绍图像识别(imagerecog)类目下的元素识别DetectImageElements的语法及示例。

功能描述

元素识别能力用于识别输入图像中所包含的元素内容,用矩形框标注出其位置,并区分其对应的基本类型(人物、修饰、文案)。

  • 输入原图 :
  • 输出结果图 :
说明
  • 您可以进入在线咨询获取在线人工帮助。
  • 当前能力可在视觉智能开放平台有完整的免费产品体验,您可以单击立即试用对该能力进行更直观试用以及在线购买。
  • 阿里云视觉智能开放平台视觉AI能力API接入、接口使用或问题咨询等,请通过钉钉群(23109592)加入阿里云视觉智能开放平台咨询群联系我们。

接入指引

1. 注册阿里云账号:打开阿里云官网,在阿里云官网右上角,单击立即注册,按照操作提示完成账号注册。

2. 开通能力:请确保您已开通图像识别服务,若未开通服务请立即开通

3. 创建AccessKey:请确保您已创建AccessKey,如果您使用的是子账号AccessKey,您需要给子账号赋予AliyunVIAPIFullAccess权限,具体操作,请参见RAM授权

4. 在线调试(可选):您可以通过OpenAPI Explorer在线调试能力,查看完整的调用示例代码及SDK依赖信息,也可以下载完整的工程。

5. 开发接入步骤:

  • SDK总览中选择您要接入使用的SDK语言。
  • 在对应语言的SDK文档中找到AI类目为图像识别(imagerecog)的SDK包进行安装。
  • 参考文档中提供的示例代码进行适当修改后调用。

6. 示例代码:该能力常用语言的示例代码,请参见元素识别示例代码

7. 客户端直接调用:该能力常用的客户端调用方式包括以下几种。

输入限制

  • 图像格式:JPG、JPEG、BMP、PNG。
  • 图像大小:不超过3 MB。
  • 图像分辨率:不超过1280×1280像素。
  • URL地址中不能包含中文字符。

计费说明

关于元素识别的计费方式及报价,请参见计费介绍

说明 下方调试接口为付费接口,如需免费体验调试请前往体验中心

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

请求参数

名称

类型

是否必选

示例值

描述

Action String DetectImageElements

系统规定参数。取值:DetectImageElements

Url String http://viapi-test.oss-cn-shanghai.aliyuncs.com/viapi-3.0domepic/imagerecog/DetectImageElements/DetectImageElements5.jpg

图像URL地址。推荐使用上海地域的OSS链接,对于文件在本地或者非上海地域OSS链接的情况,请参见文件URL处理

返回数据

名称

类型

示例值

描述

RequestId String 7EE82437-AEC4-5AAF-819F-AB28C23EE0FC

请求ID。

Data Object

返回的结果数据内容。

Elements Array of Element

元素列表。

Type String majorhuman

元素类型。包括:

UnType(未定义类型)、AllType(所有类型)、RootType(根类型)、Synthesis(组合元素图)、Embedded(所有嵌套类型)、Format(元素格式)、MajorObject(主体)、Character(文案)、Identifier(标识)、Background(背景)、Decoration(修饰)、MajorHuman(人物模特)、MajorAuction(商品)、MajorThing(物体)、MajorOther(其他主体)、CharMain(主文案)、CharSub(副文案)、CharAction(行动点文案)、CharContent(内容文案)、CharNumber(数字文案)、CharOther(其他文案)、IdentLogo(logo标识)、IdentLight(高亮标识)、IdentCode(码标识)、IdentOther(其他标识)、BackBitmap(位图背景)、BackVector(矢量图背景)、BackOther(其他背景)、DecoTile(平铺修饰)、DecoRegion(区域修饰)、DecoPieces(碎片修饰)、DecoEdge(贴边修饰)、DecoLine(线性修饰)、DecoBox(框型修饰)、DecoChar(行动点文案修饰)、DecoOther(其他修饰)、SynthMajor(主体组团)、SynthChar(文案组团)、SynthIdent(标识组团)、SynthBack(背景组团)、SynthDeco(修饰组团)、SynthOther(其他组团)、EmbedSvg(svg嵌套格式)、EmbedJson(JSON嵌套格式)、EmbedHtml(html嵌套格式)。

Width Integer 285

元素宽度。

Height Integer 354

元素高度。

Y Integer 78

元素左上角Y轴坐标。

Score Float 0.997097373008728

置信度,取值范围[0.0, 1.0]

X Integer 287

元素左上角X轴坐标。

SDK参考

阿里云视觉AI图像识别类目下的元素识别能力推荐使用SDK调用,支持多种编程语言,调用时请选择AI类目为图像识别(imagerecog)的SDK包,文件参数通过SDK调用可支持本地文件及任意URL,具体可参见SDK总览

示例代码

该能力常用语言的示例代码,请参见元素识别示例代码

示例

请求示例

http(s)://imagerecog.cn-shanghai.aliyuncs.com/?Action=DetectImageElements      //更多关于访问域名(Endpoint)信息,请参见:https://help.aliyun.com/document_detail/143103.html
&Url=http://viapi-test.oss-cn-shanghai.aliyuncs.com/viapi-3.0domepic/imagerecog/DetectImageElements/DetectImageElements5.jpg
&<公共请求参数>

正常返回示例

XML格式

HTTP/1.1 200 OK
Content-Type:application/xml

<DetectImageElementsResponse>
    <RequestId>7EE82437-AEC4-5AAF-819F-AB28C23EE0FC</RequestId>
    <Data>
        <Elements>
            <Type>character</Type>
            <Score>0.999164342880249</Score>
            <X>490</X>
            <Y>215</Y>
            <Height>66</Height>
            <Width>380</Width>
        </Elements>
        <Elements>
            <Type>character</Type>
            <Score>0.998594701290131</Score>
            <X>531</X>
            <Y>302</Y>
            <Height>38</Height>
            <Width>308</Width>
        </Elements>
        <Elements>
            <Type>majorauction</Type>
            <Score>0.983854711055756</Score>
            <X>51</X>
            <Y>80</Y>
            <Height>392</Height>
            <Width>464</Width>
        </Elements>
        <Elements>
            <Type>decoration</Type>
            <Score>0.915460407733917</Score>
            <X>596</X>
            <Y>148</Y>
            <Height>50</Height>
            <Width>170</Width>
        </Elements>
        <Elements>
            <Type>decoration</Type>
            <Score>0.777607440948486</Score>
            <X>649</X>
            <Y>149</Y>
            <Height>45</Height>
            <Width>63</Width>
        </Elements>
        <Elements>
            <Type>character</Type>
            <Score>0.712217330932617</Score>
            <X>533</X>
            <Y>349</Y>
            <Height>20</Height>
            <Width>297</Width>
        </Elements>
        <Elements>
            <Type>character</Type>
            <Score>0.701746642589569</Score>
            <X>239</X>
            <Y>129</Y>
            <Height>36</Height>
            <Width>72</Width>
        </Elements>
        <Elements>
            <Type>decoration</Type>
            <Score>0.598963797092438</Score>
            <X>594</X>
            <Y>166</Y>
            <Height>30</Height>
            <Width>67</Width>
        </Elements>
        <Elements>
            <Type>decoration</Type>
            <Score>0.502112746238708</Score>
            <X>703</X>
            <Y>167</Y>
            <Height>29</Height>
            <Width>67</Width>
        </Elements>
    </Data>
</DetectImageElementsResponse>

JSON格式

HTTP/1.1 200 OK
Content-Type:application/json

{
  "RequestId" : "7EE82437-AEC4-5AAF-819F-AB28C23EE0FC",
  "Data" : {
    "Elements" : [ {
      "Type" : "character",
      "Score" : 0.999164342880249,
      "X" : 490,
      "Y" : 215,
      "Height" : 66,
      "Width" : 380
    }, {
      "Type" : "character",
      "Score" : 0.998594701290131,
      "X" : 531,
      "Y" : 302,
      "Height" : 38,
      "Width" : 308
    }, {
      "Type" : "majorauction",
      "Score" : 0.983854711055756,
      "X" : 51,
      "Y" : 80,
      "Height" : 392,
      "Width" : 464
    }, {
      "Type" : "decoration",
      "Score" : 0.915460407733917,
      "X" : 596,
      "Y" : 148,
      "Height" : 50,
      "Width" : 170
    }, {
      "Type" : "decoration",
      "Score" : 0.777607440948486,
      "X" : 649,
      "Y" : 149,
      "Height" : 45,
      "Width" : 63
    }, {
      "Type" : "character",
      "Score" : 0.712217330932617,
      "X" : 533,
      "Y" : 349,
      "Height" : 20,
      "Width" : 297
    }, {
      "Type" : "character",
      "Score" : 0.701746642589569,
      "X" : 239,
      "Y" : 129,
      "Height" : 36,
      "Width" : 72
    }, {
      "Type" : "decoration",
      "Score" : 0.598963797092438,
      "X" : 594,
      "Y" : 166,
      "Height" : 30,
      "Width" : 67
    }, {
      "Type" : "decoration",
      "Score" : 0.502112746238708,
      "X" : 703,
      "Y" : 167,
      "Height" : 29,
      "Width" : 67
    } ]
  }
}

错误码

关于元素识别的错误码,详情请参见常见错误码

安全声明

  • 请确保上传的图片或文件来源符合相应的法律法规。
  • 通过体验调试上传的临时文件有效期为1小时,在24小时后会被系统自动清理删除。