本文介绍文字识别(ocr)类目下的表格识别RecognizeTable的语法及示例。
功能描述
表格识别能力可以自动识别表格内容信息。适用于边框线条为黑色、横竖框线齐全的表格中内容识别。
接入指引
1. 注册阿里云账号:打开阿里云官网,在阿里云官网右上角,单击立即注册,按照操作提示完成账号注册。
2. 开通能力:请确保您已开通文字识别服务,若未开通服务请立即开通。
3. 创建AccessKey:请确保您已创建AccessKey,如果您使用的是子账号AccessKey,您需要给子账号赋予AliyunVIAPIFullAccess权限,具体操作,请参见RAM授权。
4. 在线调试(可选):您可以通过OpenAPI Explorer在线调试能力,查看完整的调用示例代码及SDK依赖信息,也可以下载完整的工程。
5. 开发接入步骤:
- 在SDK总览中选择您要接入使用的SDK语言。
- 在对应语言的SDK文档中找到AI类目为文字识别(ocr)的SDK包进行安装。
- 参考文档中提供的示例代码进行适当修改后调用。
6. 示例代码:该能力常用语言的示例代码,请参见表格识别示例代码。
7. 客户端直接调用:该能力常用的客户端调用方式包括以下几种。
输入限制
- 图像格式:JPEG、JPG、PNG、BMP、GIF。
- 图像大小:不超过3 MB。
- 图像分辨率:不限制图片分辨率,但图片分辨率太高可能会导致API识别超时,超时时间为5秒。
- URL地址中不能包含中文字符。
计费说明
关于表格识别的计费方式及报价,请参见计费介绍。
调试
您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。
请求参数
名称 | 类型 | 是否必选 | 示例值 | 描述 |
---|---|---|---|---|
Action | String | 是 | RecognizeTable | 系统规定参数。取值:RecognizeTable。 |
ImageURL | String | 是 | http://viapi-test.oss-cn-shanghai.aliyuncs.com/viapi-3.0domepic/ocr/RecognizeTable/RecognizeTable4.jpg | 图像URL地址。推荐使用上海地域的OSS链接,对于文件在本地或者非上海地域OSS链接的情况,请参见文件URL处理。 |
OutputFormat | String | 是 | json | 输出格式为 |
UseFinanceModel | Boolean | 是 | true | 是否使用财务报表模型。
|
AssureDirection | Boolean | 是 | false | 图像方向是否确定为正向。
|
HasLine | Boolean | 是 | false | 是否无线条。
|
SkipDetection | Boolean | 是 | false | 是否跳过检测。
|
返回数据
名称 | 类型 | 示例值 | 描述 |
---|---|---|---|
RequestId | String | CBC36BE6-2A18-5256-82BD-8B5477E5D058 | 请求ID。 |
Data | Object | 返回的结果数据内容。 |
|
FileContent | String | UEsDBBQAAAAIAAAAIQBukMk4WAIAA**** | 请求参数 |
Tables | Array of Table | JSON格式的数据。仅在请求参数OutputFormat为 |
|
Head | Array of String | 存活盘点表 | 表头信息。 |
Tail | Array of String | 职工券 | 表尾信息。 |
TableRows | Array of TableRow | JSON格式的表格数据。 |
|
TableColumns | Array of TableColumn | JSON格式的表格数据。 |
|
EndRow | Integer | 1 | 单元格所占的行数(rowspan)为ey-sy。 |
EndColumn | Integer | 4 | 单元格所占的列数(colspan)为ex-sx。 |
Width | Integer | 0 | 图片上单元格的宽度。 |
Height | Integer | 0 | 图片上单元格的高度。 |
Texts | Array of String | 序号 | 文本,每行(row)文字为一个block。 |
StartRow | Integer | 0 | 单元格的起始行ID。 |
StartColumn | Integer | 1 | 单元格的起始列ID。 |
SDK参考
阿里云视觉AI文字识别类目下的表格识别能力推荐使用SDK调用,支持多种编程语言,调用时请选择AI类目为文字识别(ocr)的SDK包,文件参数通过SDK调用可支持本地文件及任意URL,具体可参见SDK总览。
示例代码
该能力常用语言的示例代码,请参见表格识别示例代码。
示例
请求示例
http(s)://ocr.cn-shanghai.aliyuncs.com/?Action=RecognizeTable //更多关于访问域名(Endpoint)信息,请参见:https://help.aliyun.com/document_detail/143103.html
&ImageURL=http://viapi-test.oss-cn-shanghai.aliyuncs.com/viapi-3.0domepic/ocr/RecognizeTable/RecognizeTable4.jpg
&OutputFormat=json
&UseFinanceModel=true
&AssureDirection=false
&HasLine=false
&SkipDetection=false
&公共请求参数
正常返回示例
JSON
格式
HTTP/1.1 200 OK
Content-Type:application/json
{
"RequestId" : "CBC36BE6-2A18-5256-82BD-8B5477E5D058",
"Data" : {
"Tables" : {
"Head" : "存活盘点表",
"TableRows" : [ {
"TableColumns" : [ {
"EndRow" : 1,
"EndColumn" : 1,
"Texts" : "序号",
"Height" : 0,
"Width" : 0,
"StartRow" : 0,
"StartColumn" : 0
}, {
"EndRow" : 1,
"EndColumn" : 2,
"Texts" : "存货名称",
"Height" : 0,
"Width" : 0,
"StartRow" : 0,
"StartColumn" : 1
}, {
"EndRow" : 1,
"EndColumn" : 3,
"Texts" : "计量单位",
"Height" : 0,
"Width" : 0,
"StartRow" : 0,
"StartColumn" : 2
}, {
"EndRow" : 1,
"EndColumn" : 4,
"Texts" : "数量",
"Height" : 0,
"Width" : 0,
"StartRow" : 0,
"StartColumn" : 3
}, {
"EndRow" : 1,
"EndColumn" : 5,
"Texts" : "单价",
"Height" : 0,
"Width" : 0,
"StartRow" : 0,
"StartColumn" : 4
}, {
"EndRow" : 1,
"EndColumn" : 6,
"Texts" : "账面金额",
"Height" : 0,
"Width" : 0,
"StartRow" : 0,
"StartColumn" : 5
}, {
"EndRow" : 1,
"EndColumn" : 7,
"Texts" : "备注",
"Height" : 0,
"Width" : 0,
"StartRow" : 0,
"StartColumn" : 6
} ]
}, {
"TableColumns" : [ {
"EndRow" : 2,
"EndColumn" : 1,
"Texts" : 1,
"Height" : 0,
"Width" : 0,
"StartRow" : 1,
"StartColumn" : 0
}, {
"EndRow" : 2,
"EndColumn" : 2,
"Texts" : "发电机",
"Height" : 0,
"Width" : 0,
"StartRow" : 1,
"StartColumn" : 1
}, {
"EndRow" : 2,
"EndColumn" : 3,
"Texts" : "台",
"Height" : 0,
"Width" : 0,
"StartRow" : 1,
"StartColumn" : 2
}, {
"EndRow" : 2,
"EndColumn" : 4,
"Texts" : 2,
"Height" : 0,
"Width" : 0,
"StartRow" : 1,
"StartColumn" : 3
}, {
"EndRow" : 2,
"EndColumn" : 5,
"Texts" : "499,222,12",
"Height" : 0,
"Width" : 0,
"StartRow" : 1,
"StartColumn" : 4
}, {
"EndRow" : 2,
"EndColumn" : 6,
"Texts" : 99844424,
"Height" : 0,
"Width" : 0,
"StartRow" : 1,
"StartColumn" : 5
}, {
"EndRow" : 2,
"EndColumn" : 7,
"Height" : 0,
"Width" : 0,
"StartRow" : 1,
"StartColumn" : 6
} ]
}, {
"TableColumns" : [ {
"EndRow" : 3,
"EndColumn" : 1,
"Texts" : 2,
"Height" : 0,
"Width" : 0,
"StartRow" : 2,
"StartColumn" : 0
}, {
"EndRow" : 3,
"EndColumn" : 2,
"Texts" : "变压器",
"Height" : 0,
"Width" : 0,
"StartRow" : 2,
"StartColumn" : 1
}, {
"EndRow" : 3,
"EndColumn" : 3,
"Texts" : "台",
"Height" : 0,
"Width" : 0,
"StartRow" : 2,
"StartColumn" : 2
}, {
"EndRow" : 3,
"EndColumn" : 4,
"Texts" : 1,
"Height" : 0,
"Width" : 0,
"StartRow" : 2,
"StartColumn" : 3
}, {
"EndRow" : 3,
"EndColumn" : 5,
"Texts" : "205,121,18",
"Height" : 0,
"Width" : 0,
"StartRow" : 2,
"StartColumn" : 4
}, {
"EndRow" : 3,
"EndColumn" : 6,
"Texts" : "205,121,18",
"Height" : 0,
"Width" : 0,
"StartRow" : 2,
"StartColumn" : 5
}, {
"EndRow" : 3,
"EndColumn" : 7,
"Height" : 0,
"Width" : 0,
"StartRow" : 2,
"StartColumn" : 6
} ]
}, {
"TableColumns" : [ {
"EndRow" : 4,
"EndColumn" : 1,
"Texts" : 3,
"Height" : 0,
"Width" : 0,
"StartRow" : 3,
"StartColumn" : 0
}, {
"EndRow" : 4,
"EndColumn" : 2,
"Texts" : "豆浆生产线",
"Height" : 0,
"Width" : 0,
"StartRow" : 3,
"StartColumn" : 1
}, {
"EndRow" : 4,
"EndColumn" : 3,
"Texts" : "台",
"Height" : 0,
"Width" : 0,
"StartRow" : 3,
"StartColumn" : 2
}, {
"EndRow" : 4,
"EndColumn" : 4,
"Texts" : 1,
"Height" : 0,
"Width" : 0,
"StartRow" : 3,
"StartColumn" : 3
}, {
"EndRow" : 4,
"EndColumn" : 5,
"Texts" : "123,987,23",
"Height" : 0,
"Width" : 0,
"StartRow" : 3,
"StartColumn" : 4
}, {
"EndRow" : 4,
"EndColumn" : 6,
"Texts" : "123,987,23",
"Height" : 0,
"Width" : 0,
"StartRow" : 3,
"StartColumn" : 5
}, {
"EndRow" : 4,
"EndColumn" : 7,
"Height" : 0,
"Width" : 0,
"StartRow" : 3,
"StartColumn" : 6
} ]
}, {
"TableColumns" : [ {
"EndRow" : 5,
"EndColumn" : 1,
"Texts" : 4,
"Height" : 0,
"Width" : 0,
"StartRow" : 4,
"StartColumn" : 0
}, {
"EndRow" : 5,
"EndColumn" : 2,
"Height" : 0,
"Width" : 0,
"StartRow" : 4,
"StartColumn" : 1
}, {
"EndRow" : 5,
"EndColumn" : 3,
"Height" : 0,
"Width" : 0,
"StartRow" : 4,
"StartColumn" : 2
}, {
"EndRow" : 5,
"EndColumn" : 4,
"Height" : 0,
"Width" : 0,
"StartRow" : 4,
"StartColumn" : 3
}, {
"EndRow" : 5,
"EndColumn" : 5,
"Height" : 0,
"Width" : 0,
"StartRow" : 4,
"StartColumn" : 4
}, {
"EndRow" : 5,
"EndColumn" : 6,
"Height" : 0,
"Width" : 0,
"StartRow" : 4,
"StartColumn" : 5
}, {
"EndRow" : 5,
"EndColumn" : 7,
"Height" : 0,
"Width" : 0,
"StartRow" : 4,
"StartColumn" : 6
} ]
}, {
"TableColumns" : [ {
"EndRow" : 6,
"EndColumn" : 1,
"Texts" : 5,
"Height" : 0,
"Width" : 0,
"StartRow" : 5,
"StartColumn" : 0
}, {
"EndRow" : 6,
"EndColumn" : 2,
"Height" : 0,
"Width" : 0,
"StartRow" : 5,
"StartColumn" : 1
}, {
"EndRow" : 6,
"EndColumn" : 3,
"Height" : 0,
"Width" : 0,
"StartRow" : 5,
"StartColumn" : 2
}, {
"EndRow" : 6,
"EndColumn" : 4,
"Height" : 0,
"Width" : 0,
"StartRow" : 5,
"StartColumn" : 3
}, {
"EndRow" : 6,
"EndColumn" : 5,
"Height" : 0,
"Width" : 0,
"StartRow" : 5,
"StartColumn" : 4
}, {
"EndRow" : 6,
"EndColumn" : 6,
"Height" : 0,
"Width" : 0,
"StartRow" : 5,
"StartColumn" : 5
}, {
"EndRow" : 6,
"EndColumn" : 7,
"Height" : 0,
"Width" : 0,
"StartRow" : 5,
"StartColumn" : 6
} ]
}, {
"TableColumns" : [ {
"EndRow" : 7,
"EndColumn" : 1,
"Texts" : 6,
"Height" : 0,
"Width" : 0,
"StartRow" : 6,
"StartColumn" : 0
}, {
"EndRow" : 7,
"EndColumn" : 2,
"Height" : 0,
"Width" : 0,
"StartRow" : 6,
"StartColumn" : 1
}, {
"EndRow" : 7,
"EndColumn" : 3,
"Height" : 0,
"Width" : 0,
"StartRow" : 6,
"StartColumn" : 2
}, {
"EndRow" : 7,
"EndColumn" : 4,
"Height" : 0,
"Width" : 0,
"StartRow" : 6,
"StartColumn" : 3
}, {
"EndRow" : 7,
"EndColumn" : 5,
"Height" : 0,
"Width" : 0,
"StartRow" : 6,
"StartColumn" : 4
}, {
"EndRow" : 7,
"EndColumn" : 6,
"Height" : 0,
"Width" : 0,
"StartRow" : 6,
"StartColumn" : 5
}, {
"EndRow" : 7,
"EndColumn" : 7,
"Height" : 0,
"Width" : 0,
"StartRow" : 6,
"StartColumn" : 6
} ]
}, {
"TableColumns" : [ {
"EndRow" : 8,
"EndColumn" : 1,
"Texts" : 7,
"Height" : 0,
"Width" : 0,
"StartRow" : 7,
"StartColumn" : 0
}, {
"EndRow" : 8,
"EndColumn" : 2,
"Height" : 0,
"Width" : 0,
"StartRow" : 7,
"StartColumn" : 1
}, {
"EndRow" : 8,
"EndColumn" : 3,
"Height" : 0,
"Width" : 0,
"StartRow" : 7,
"StartColumn" : 2
}, {
"EndRow" : 8,
"EndColumn" : 4,
"Height" : 0,
"Width" : 0,
"StartRow" : 7,
"StartColumn" : 3
}, {
"EndRow" : 8,
"EndColumn" : 5,
"Height" : 0,
"Width" : 0,
"StartRow" : 7,
"StartColumn" : 4
}, {
"EndRow" : 8,
"EndColumn" : 6,
"Height" : 0,
"Width" : 0,
"StartRow" : 7,
"StartColumn" : 5
}, {
"EndRow" : 8,
"EndColumn" : 7,
"Height" : 0,
"Width" : 0,
"StartRow" : 7,
"StartColumn" : 6
} ]
} ]
}
}
}
错误码
关于表格识别的错误码,详情请参见常见错误码。
安全声明
- 请确保上传的图片或文件来源符合相应的法律法规。
- 通过体验调试上传的临时文件有效期为1小时,在24小时后会被系统自动清理删除。