针对拉丁语系的图片文档场景下印刷体高效检测和识别,支持旋转、表格、文字坐标等多项基础功能。
调试
您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。
授权信息
下表是API对应的授权信息,可以在RAM权限策略语句的Action
元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:
- 操作:是指具体的权限点。
- 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
- 资源类型:是指操作中支持授权的资源类型。具体说明如下:
- 对于必选的资源类型,用背景高亮的方式表示。
- 对于不支持资源级授权的操作,用
全部资源
表示。
- 条件关键字:是指云产品自身定义的条件关键字。
- 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
操作 | 访问级别 | 资源类型 | 条件关键字 | 关联操作 |
---|---|---|---|---|
ocr:RecognizeLatin | *全部资源 * |
| 无 |
请求参数
名称 | 类型 | 必填 | 描述 | 示例值 |
---|---|---|---|---|
Url | string | 否 | 图片链接(长度不超 2048 字节,不支持 base64) | https://img.alicdn.com/tfs/TB1Wo7eXAvoK1RjSZFDXXXY3pXa-2512-3509.jpg |
body | byte | 否 | 图片二进制文件,最大 10MB,与 URL 二选一。 使用 HTTP 方式调用,把图片二进制文件放到 HTTP body 中上传即可。 使用 SDK 的方式调用,把图片放到 SDK 的 body 中即可。 | 图片二进制文件 |
OutputCharInfo | boolean | 否 | 是否输出单字识别结果 | false |
NeedRotate | boolean | 否 | 是否需要自动旋转功能(结构化检测、混贴场景、教育相关场景会自动做旋转,无需设置),返回角度信息 | false |
OutputTable | boolean | 否 | 是否输出表格识别结果,包含单元格信息 | false |
返回参数
返回数据说明
angle 图片的角度,0 表示正向,90 表示图片朝右,180 朝下,270 朝左</br>
content 识别出图片的文字块汇总</br>
height 算法矫正图片后的高度</br>
width 算法矫正图片后的宽度</br>
orgHeight 原图的高度</br>
orgWidth 原图的宽度</br>
prism_wnum 识别的文字块的数量,prism_wordsInfo 数组的大小</br>
-------------------------prism-wordsInfo 文字块数组内的字段说明-------------------------</br>
angle 文字块的角度,这个角度只影响 width 和 height,当角度为-90、90、-270、270,width 和 height 的值需要自行互换</br>
height 文字块的高度</br>
width 文字块的宽度</br>
pos 文字块的外矩形四个点的坐标按顺时针排列,左上、右上、右下、左下,当 NeedRotate 为 true 时,如果最外层的 angle 不为 0,需要按照 angle 矫正图片后,坐标才准确</br>
word 文字块的文字</br>
tableId 当 OutputTable 为 true 并且该文字块在表格内则存在该字段,tableId 表示表格的 id</br>
tableCellId 当 OutputTable 为 true 并且该文字块在表格内则存在该字段,表示表格中单元格的 id</br>
----------------------------------------charInfo 单字信息-----------------------------------------</br>
word 单字文字</br>
x 单字左上角横坐标</br>
y 单字左上角纵坐标</br>
w 单字宽度
<span>h 单字高度</span></br>
--------------------------------------------------------------------------------------------------------</br>
--------------------------------------------------------------------------------------------------------</br>
---------------------------prism-tablesInfo 表格数组内的字段说明--------------------------</br>
tableId 表格 id,和 prism_wordsInfo 信息中的 tableId 对应</br>
xCellSize 表格中横坐标单元格的数量</br>
yCellSize 表格中纵坐标单元格的数量</br>
------------cellInfos 单元格信息,包含单元格在整个表格中的空间拓扑关系---------</br>
tableCellId 表格中单元格 id,和 prism_wordsInfo 信息中的 tableCellId 对应</br>
word 单元格中的文字</br>
xsc xStartCell 缩写,表示横轴方向该单元格起始在第几个单元格,第一个单元格值为 0</br>
xec xEndCell 缩写,表示横轴方向该单元格结束在第几个单元格,第一个单元格值为 0,如果 xsc 和 xec 都为 0 说明该文字在横轴方向占据了一个单元格并且在第一个单元格内</br>
ysc yStartCell 缩写,表示纵轴方向该单元格起始在第几个单元格,第一个单元格值为 0</br>
yec yEndCell 缩写,表示纵轴方向该单元格结束在第几个单元格,第一个单元格值为 0</br>
pos 单元格位置,按照单元格四个角的坐标顺时针排列,分别为左上 XY 坐标、右上 XY 坐标、右下 XY 坐标、左下 XY 坐标</br>
--------------------------------------------------------------------------------------------------------</br>
--------------------------------------------------------------------------------------------------------</br>
示例
正常返回示例
JSON
格式
{
"RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
"Data": "{\"angle\":1,\"content\":\"Đậm Phong Cách Khác Biêt Trên tay chế tác nguyên khối dẫn đầu xu hướng với thiết kế thần máy liền mạch, độ mông ấn tượng 8.5mm cùng kiểu dáng mặt kinh bóng mượt, sang trọng từ Galaxy M30. Vừa vặn hoền hẩo trong lông bần tay, tho thích thể hiện phong cách thời thượng với hai phiên bản màu Đen hoặc Xanh cắ tính. xanh Ngân Hà Đen Ngả Khói OC S \",\"height\":821,\"orgHeight\":803,\"orgWidth\":1075,\"prism_version\":\"1.0.9\",\"prism_wnum\":9,\"prism_wordsInfo\":[{\"angle\":0,\"direction\":0,\"height\":37,\"pos\":[{\"x\":293,\"y\":37},{\"x\":776,\"y\":29},{\"x\":777,\"y\":66},{\"x\":294,\"y\":74}],\"prob\":99,\"width\":484,\"word\":\"Đậm Phong Cách\",\"x\":292,\"y\":24}],\"width\":1088}",
"Code": "200",
"Message": "message"
}
错误码
访问错误中心查看更多错误码。
变更历史
变更时间 | 变更内容概要 | 操作 |
---|---|---|
2021-08-17 | OpenAPI 入参发生变更 | 查看变更详情 |