RecognizeLatin - 拉丁语识别

针对拉丁语系的图片文档场景下印刷体高效检测和识别,支持旋转、表格、文字坐标等多项基础功能。

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

授权信息

下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:

  • 操作:是指具体的权限点。
  • 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
  • 资源类型:是指操作中支持授权的资源类型。具体说明如下:
    • 对于必选的资源类型,用背景高亮的方式表示。
    • 对于不支持资源级授权的操作,用全部资源表示。
  • 条件关键字:是指云产品自身定义的条件关键字。
  • 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
操作访问级别资源类型条件关键字关联操作
ocr:RecognizeLatin
  • 全部资源
    *

请求参数

名称类型必填描述示例值
Urlstring

图片链接(长度不超 2048 字节,不支持 base64)

https://img.alicdn.com/tfs/TB1Wo7eXAvoK1RjSZFDXXXY3pXa-2512-3509.jpg
bodybyte

图片二进制文件,最大 10MB,与 URL 二选一。 使用 HTTP 方式调用,把图片二进制文件放到 HTTP body 中上传即可。 使用 SDK 的方式调用,把图片放到 SDK 的 body 中即可。

图片二进制文件
OutputCharInfoboolean

是否输出单字识别结果

false
NeedRotateboolean

是否需要自动旋转功能(结构化检测、混贴场景、教育相关场景会自动做旋转,无需设置),返回角度信息

false
OutputTableboolean

是否输出表格识别结果,包含单元格信息

false

支持的图片格式

  • PNG、JPG、JPEG、BMP、GIF、TIFF、WebP

返回参数

名称类型描述示例值
object

Schema of Response

RequestIdstring

请求唯一 ID

43A29C77-405E-4CC0-BC55-EE694AD00655
Datastring

返回数据

{"angle":1,"content":"Đậm Phong Cách Khác Biêt Trên tay chế tác nguyên khối dẫn đầu xu hướng với thiết kế thần máy liền mạch, độ mông ấn tượng 8.5mm cùng kiểu dáng mặt kinh bóng mượt, sang trọng từ Galaxy M30. Vừa vặn hoền hẩo trong lông bần tay, tho thích thể hiện phong cách thời thượng với hai phiên bản màu Đen hoặc Xanh cắ tính. xanh Ngân Hà Đen Ngả Khói OC S ","height":821,"orgHeight":803,"orgWidth":1075,"prism_version":"1.0.9","prism_wnum":9,"prism_wordsInfo":[{"angle":0,"direction":0,"height":37,"pos":[{"x":293,"y":37},{"x":776,"y":29},{"x":777,"y":66},{"x":294,"y":74}],"prob":99,"width":484,"word":"Đậm Phong Cách","x":292,"y":24}],"width":1088}
Codestring

状态码

200
Messagestring

详细信息

message

返回数据说明

angle                  图片的角度,0 表示正向,90 表示图片朝右,180 朝下,270 朝左</br>
content              识别出图片的文字块汇总</br>
height                算法矫正图片后的高度</br>
width                 算法矫正图片后的宽度</br>
orgHeight          原图的高度</br>
orgWidth           原图的宽度</br>
prism_wnum      识别的文字块的数量,prism_wordsInfo 数组的大小</br>
-------------------------prism-wordsInfo 文字块数组内的字段说明-------------------------</br>
angle                 文字块的角度,这个角度只影响 width 和 height,当角度为-90、90、-270、270,width 和 height 的值需要自行互换</br>
height                文字块的高度</br>
width                 文字块的宽度</br>
pos                    文字块的外矩形四个点的坐标按顺时针排列,左上、右上、右下、左下,当 NeedRotate 为 true 时,如果最外层的 angle 不为 0,需要按照 angle 矫正图片后,坐标才准确</br>
word                  文字块的文字</br>
tableId               当 OutputTable 为 true 并且该文字块在表格内则存在该字段,tableId 表示表格的 id</br>
tableCellId         当 OutputTable 为 true 并且该文字块在表格内则存在该字段,表示表格中单元格的 id</br>
----------------------------------------charInfo 单字信息-----------------------------------------</br>
word                  单字文字</br>
x                        单字左上角横坐标</br>
y                        单字左上角纵坐标</br>
w                       单字宽度
<span>h                       单字高度</span></br>
--------------------------------------------------------------------------------------------------------</br>
--------------------------------------------------------------------------------------------------------</br>
---------------------------prism-tablesInfo 表格数组内的字段说明--------------------------</br>
tableId               表格 id,和 prism_wordsInfo 信息中的 tableId 对应</br>
xCellSize            表格中横坐标单元格的数量</br>
yCellSize            表格中纵坐标单元格的数量</br>
------------cellInfos 单元格信息,包含单元格在整个表格中的空间拓扑关系---------</br>
tableCellId         表格中单元格 id,和 prism_wordsInfo 信息中的 tableCellId 对应</br>
word                 单元格中的文字</br>
xsc                    xStartCell 缩写,表示横轴方向该单元格起始在第几个单元格,第一个单元格值为 0</br>
xec                    xEndCell 缩写,表示横轴方向该单元格结束在第几个单元格,第一个单元格值为 0,如果 xsc 和 xec 都为 0 说明该文字在横轴方向占据了一个单元格并且在第一个单元格内</br>
ysc                    yStartCell 缩写,表示纵轴方向该单元格起始在第几个单元格,第一个单元格值为 0</br>
yec                    yEndCell 缩写,表示纵轴方向该单元格结束在第几个单元格,第一个单元格值为 0</br>
pos                   单元格位置,按照单元格四个角的坐标顺时针排列,分别为左上 XY 坐标、右上 XY 坐标、右下 XY 坐标、左下 XY 坐标</br>
--------------------------------------------------------------------------------------------------------</br>
--------------------------------------------------------------------------------------------------------</br>

示例

正常返回示例

JSON格式

{
  "RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
  "Data": "{\"angle\":1,\"content\":\"Đậm Phong Cách Khác Biêt  Trên tay chế tác nguyên khối dẫn đầu xu hướng với thiết kế thần máy liền mạch, độ mông ấn tượng 8.5mm cùng   kiểu dáng mặt kinh bóng mượt, sang trọng từ Galaxy M30. Vừa vặn hoền hẩo trong lông bần tay, tho thích thể hiện   phong cách thời thượng với hai phiên bản màu Đen hoặc Xanh cắ tính.  xanh Ngân Hà   Đen Ngả Khói  OC S   \",\"height\":821,\"orgHeight\":803,\"orgWidth\":1075,\"prism_version\":\"1.0.9\",\"prism_wnum\":9,\"prism_wordsInfo\":[{\"angle\":0,\"direction\":0,\"height\":37,\"pos\":[{\"x\":293,\"y\":37},{\"x\":776,\"y\":29},{\"x\":777,\"y\":66},{\"x\":294,\"y\":74}],\"prob\":99,\"width\":484,\"word\":\"Đậm Phong Cách\",\"x\":292,\"y\":24}],\"width\":1088}",
  "Code": "200",
  "Message": "message"
}

错误码

访问错误中心查看更多错误码。

变更历史

变更时间变更内容概要操作
2021-08-17OpenAPI 入参发生变更查看变更详情