本文介绍文字识别(ocr)类目下的通用文字识别RecognizeCharacter的语法及示例。
功能描述
通用文字识别能力可以识别图像中文字内容和文字区域坐标,适用于多场景图像文字识别。
接入指引
1. 注册阿里云账号:打开阿里云官网,在阿里云官网右上角,单击立即注册,按照操作提示完成账号注册。
2. 开通能力:请确保您已开通文字识别服务,若未开通服务请立即开通。
3. 创建AccessKey:请确保您已创建AccessKey,如果您使用的是子账号AccessKey,您需要给子账号赋予AliyunVIAPIFullAccess权限,具体操作,请参见RAM授权。
4. 在线调试(可选):您可以通过OpenAPI Explorer在线调试能力,查看完整的调用示例代码及SDK依赖信息,也可以下载完整的工程。
5. 开发接入步骤:
- 在SDK总览中选择您要接入使用的SDK语言。
- 在对应语言的SDK文档中找到AI类目为文字识别(ocr)的SDK包进行安装。
- 参考文档中提供的示例代码进行适当修改后调用。
6. 示例代码:该能力常用语言的示例代码,请参见通用文字识别示例代码。
7. 客户端直接调用:该能力常用的客户端调用方式包括以下几种。
输入限制
- 图像格式:JPEG、JPG、PNG、BMP、GIF。
- 图像大小:不超过3 MB。
- 图像分辨率:大于15×15像素,小于4096×4096像素。
- URL地址中不能包含中文字符。
计费说明
关于通用文字识别的计费方式及报价,请参见计费介绍。
调试
您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。
请求参数
名称 | 类型 | 是否必选 | 示例值 | 描述 |
---|---|---|---|---|
Action | String | 是 | RecognizeCharacter | 系统规定参数。取值:RecognizeCharacter。 |
ImageURL | String | 是 | http://viapi-test.oss-cn-shanghai.aliyuncs.com/viapi-3.0domepic/ocr/RecognizeCharacter/RecognizeCharacter5.jpg | 图像URL地址。推荐使用上海地域的OSS链接,对于文件在本地或者非上海地域OSS链接的情况,请参见文件URL处理。 |
MinHeight | Integer | 是 | 10 | 图像中文字的最小高度,单位像素。 |
OutputProbability | Boolean | 是 | true | 是否输出文字框的概率。取值:
|
返回数据
名称 | 类型 | 示例值 | 描述 |
---|---|---|---|
RequestId | String | 7A9BC7FE-2D42-57AF-93BC-09A229DD2F1D | 请求ID。 |
Data | Object | 返回的结果数据内容。 |
|
Results | Array of Result | 返回识别信息。 |
|
TextRectangles | Object | 文字框区域位置。 |
|
Top | Integer | 150 | 文字区域左上角y坐标。 |
Width | Integer | 77 | 文字区域宽度。 |
Height | Integer | 409 | 文字区域高度。 |
Angle | Integer | -65 | 文字区域角度,角度范围 说明 以文字区域中心点为旋转点,向右旋转角度为正,向左旋转角度为负。 |
Left | Integer | 511 | 文字区域左上角x坐标。 |
Text | String | 祝你生日快乐 | 文字内容。 |
Probability | Float | 0.99 | 文字内容的概率,取值范围为0~1。 |
SDK参考
阿里云视觉AI文字识别类目下的通用文字识别能力推荐使用SDK调用,支持多种编程语言,调用时请选择AI类目为文字识别(ocr)的SDK包,文件参数通过SDK调用可支持本地文件及任意URL,具体可参见SDK总览。
示例代码
该能力常用语言的示例代码,请参见通用文字识别示例代码。
示例
请求示例
http(s)://ocr.cn-shanghai.aliyuncs.com/?Action=RecognizeCharacter //更多关于访问域名(Endpoint)信息,请参见:https://help.aliyun.com/document_detail/143103.html
&ImageURL=http://viapi-test.oss-cn-shanghai.aliyuncs.com/viapi-3.0domepic/ocr/RecognizeCharacter/RecognizeCharacter5.jpg
&MinHeight=10
&OutputProbability=true
&公共请求参数
正常返回示例
XML
格式
HTTP/1.1 200 OK
Content-Type:application/xml
<RecognizeCharacterResponse>
<RequestId>7A9BC7FE-2D42-57AF-93BC-09A229DD2F1D</RequestId>
<Data>
<Results>
<TextRectangles>
<Left>599</Left>
<Top>160</Top>
<Angle>-69</Angle>
<Height>107</Height>
<Width>26</Width>
</TextRectangles>
<Probability>0.99</Probability>
<Text>HAPPY</Text>
</Results>
<Results>
<TextRectangles>
<Left>576</Left>
<Top>150</Top>
<Angle>-63</Angle>
<Height>200</Height>
<Width>37</Width>
</TextRectangles>
<Probability>0.99</Probability>
<Text>birthday</Text>
</Results>
<Results>
<TextRectangles>
<Left>511</Left>
<Top>150</Top>
<Angle>-65</Angle>
<Height>409</Height>
<Width>77</Width>
</TextRectangles>
<Probability>0.99</Probability>
<Text>祝你生日快乐</Text>
</Results>
</Data>
</RecognizeCharacterResponse>
JSON
格式
HTTP/1.1 200 OK
Content-Type:application/json
{
"RequestId" : "7A9BC7FE-2D42-57AF-93BC-09A229DD2F1D",
"Data" : {
"Results" : [ {
"TextRectangles" : {
"Left" : 599,
"Top" : 160,
"Angle" : -69,
"Height" : 107,
"Width" : 26
},
"Probability" : 0.99,
"Text" : "HAPPY"
}, {
"TextRectangles" : {
"Left" : 576,
"Top" : 150,
"Angle" : -63,
"Height" : 200,
"Width" : 37
},
"Probability" : 0.99,
"Text" : "birthday"
}, {
"TextRectangles" : {
"Left" : 511,
"Top" : 150,
"Angle" : -65,
"Height" : 409,
"Width" : 77
},
"Probability" : 0.99,
"Text" : "祝你生日快乐"
} ]
}
}
错误码
关于通用文字识别的错误码,详情请参见常见错误码。
安全声明
- 请确保上传的图片或文件来源符合相应的法律法规。
- 通过体验调试上传的临时文件有效期为1小时,在24小时后会被系统自动清理删除。