针对全日文图片文档场景下日文印刷体高效检测和识别,支持旋转、表格、文字坐标等多项基础功能。
调试
您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。
授权信息
下表是API对应的授权信息,可以在RAM权限策略语句的Action
元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:
- 操作:是指具体的权限点。
- 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
- 资源类型:是指操作中支持授权的资源类型。具体说明如下:
- 对于必选的资源类型,用背景高亮的方式表示。
- 对于不支持资源级授权的操作,用
全部资源
表示。
- 条件关键字:是指云产品自身定义的条件关键字。
- 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
操作 | 访问级别 | 资源类型 | 条件关键字 | 关联操作 |
---|---|---|---|---|
ocr:RecognizeJanpanese | *全部资源 * |
| 无 |
请求参数
名称 | 类型 | 必填 | 描述 | 示例值 |
---|---|---|---|---|
Url | string | 否 | 图片链接(长度不超 2048 字节,不支持 base64) | https://img.alicdn.com/tfs/TB1Wo7eXAvoK1RjSZFDXXXY3pXa-2512-3509.jpg |
body | byte | 否 | 图片二进制文件,最大 10MB,与 URL 二选一。 使用 HTTP 方式调用,把图片二进制文件放到 HTTP body 中上传即可。 使用 SDK 的方式调用,把图片放到 SDK 的 body 中即可 | 图片二进制文件 |
OutputCharInfo | boolean | 否 | 是否输出单字识别结果 | false |
NeedRotate | boolean | 否 | 是否需要自动旋转功能(结构化检测、混贴场景、教育相关场景会自动做旋转,无需设置),返回角度信息 | false |
OutputTable | boolean | 否 | 是否输出表格识别结果,包含单元格信息 | false |
返回参数
返回数据说明
angle 图片的角度,0 表示正向,90 表示图片朝右,180 朝下,270 朝左</br>
content 识别出图片的文字块汇总</br>
height 算法矫正图片后的高度</br>
width 算法矫正图片后的宽度</br>
orgHeight 原图的高度</br>
orgWidth 原图的宽度</br>
prism_wnum 识别的文字块的数量,prism_wordsInfo 数组的大小</br>
-------------------------prism-wordsInfo 文字块数组内的字段说明-------------------------</br>
angle 文字块的角度,这个角度只影响 width 和 height,当角度为-90、90、-270、270,width 和 height 的值需要自行互换</br>
height 文字块的高度</br>
width 文字块的宽度</br>
pos 文字块的外矩形四个点的坐标按顺时针排列,左上、右上、右下、左下,当 NeedRotate 为 true 时,如果最外层的 angle 不为 0,需要按照 angle 矫正图片后,坐标才准确</br>
word 文字块的文字</br>
tableId 当 OutputTable 为 true 并且该文字块在表格内则存在该字段,tableId 表示表格的 id</br>
tableCellId 当 OutputTable 为 true 并且该文字块在表格内则存在该字段,表示表格中单元格的 id</br>
----------------------------------------charInfo 单字信息-----------------------------------------</br>
word 单字文字</br>
x 单字左上角横坐标</br>
y 单字左上角纵坐标</br>
w 单字宽度
<span>h 单字高度</span></br>
--------------------------------------------------------------------------------------------------------</br>
--------------------------------------------------------------------------------------------------------</br>
---------------------------prism-tablesInfo 表格数组内的字段说明--------------------------</br>
tableId 表格 id,和 prism_wordsInfo 信息中的 tableId 对应</br>
xCellSize 表格中横坐标单元格的数量</br>
yCellSize 表格中纵坐标单元格的数量</br>
------------cellInfos 单元格信息,包含单元格在整个表格中的空间拓扑关系---------</br>
tableCellId 表格中单元格 id,和 prism_wordsInfo 信息中的 tableCellId 对应</br>
word 单元格中的文字</br>
xsc xStartCell 缩写,表示横轴方向该单元格起始在第几个单元格,第一个单元格值为 0</br>
xec xEndCell 缩写,表示横轴方向该单元格结束在第几个单元格,第一个单元格值为 0,如果 xsc 和 xec 都为 0 说明该文字在横轴方向占据了一个单元格并且在第一个单元格内</br>
ysc yStartCell 缩写,表示纵轴方向该单元格起始在第几个单元格,第一个单元格值为 0</br>
yec yEndCell 缩写,表示纵轴方向该单元格结束在第几个单元格,第一个单元格值为 0</br>
pos 单元格位置,按照单元格四个角的坐标顺时针排列,分别为左上 XY 坐标、右上 XY 坐标、右下 XY 坐标、左下 XY 坐标</br>
--------------------------------------------------------------------------------------------------------</br>
--------------------------------------------------------------------------------------------------------</br>
示例
正常返回示例
JSON
格式
{
"RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
"Data": "{\"content\":\"いくら飞すか (多少钱?) \",\"height\":384,\"orgHeight\":384,\"orgWidth\":512,\"prism_version\":\"1.0.9\",\"prism_wnum\":2,\"prism_wordsInfo\":[{\"angle\":-89,\"direction\":0,\"height\":508,\"pos\":[{\"x\":2,\"y\":85},{\"x\":509,\"y\":85},{\"x\":509,\"y\":170},{\"x\":2,\"y\":170}],\"prob\":99,\"width\":84,\"word\":\"いくら飞すか\",\"x\":213,\"y\":-126}],\"width\":512}",
"Code": "200",
"Message": "message"
}
错误码
访问错误中心查看更多错误码。
变更历史
变更时间 | 变更内容概要 | 操作 |
---|---|---|
2021-08-17 | OpenAPI 入参发生变更 | 查看变更详情 |