RecognizeJanpanese - 日语识别

针对全日文图片文档场景下日文印刷体高效检测和识别,支持旋转、表格、文字坐标等多项基础功能。

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

授权信息

下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:

  • 操作:是指具体的权限点。
  • 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
  • 资源类型:是指操作中支持授权的资源类型。具体说明如下:
    • 对于必选的资源类型,用背景高亮的方式表示。
    • 对于不支持资源级授权的操作,用全部资源表示。
  • 条件关键字:是指云产品自身定义的条件关键字。
  • 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
操作访问级别资源类型条件关键字关联操作
ocr:RecognizeJanpanese
  • 全部资源
    *

请求参数

名称类型必填描述示例值
Urlstring

图片链接(长度不超 2048 字节,不支持 base64)

https://img.alicdn.com/tfs/TB1Wo7eXAvoK1RjSZFDXXXY3pXa-2512-3509.jpg
bodybyte

图片二进制文件,最大 10MB,与 URL 二选一。 使用 HTTP 方式调用,把图片二进制文件放到 HTTP body 中上传即可。 使用 SDK 的方式调用,把图片放到 SDK 的 body 中即可

图片二进制文件
OutputCharInfoboolean

是否输出单字识别结果

false
NeedRotateboolean

是否需要自动旋转功能(结构化检测、混贴场景、教育相关场景会自动做旋转,无需设置),返回角度信息

false
OutputTableboolean

是否输出表格识别结果,包含单元格信息

false

支持的图片格式

  • PNG、JPG、JPEG、BMP、GIF、TIFF、WebP

返回参数

名称类型描述示例值
object

Schema of Response

RequestIdstring

请求唯一 ID

43A29C77-405E-4CC0-BC55-EE694AD00655
Datastring

返回数据

{"content":"いくら飞すか (多少钱?) ","height":384,"orgHeight":384,"orgWidth":512,"prism_version":"1.0.9","prism_wnum":2,"prism_wordsInfo":[{"angle":-89,"direction":0,"height":508,"pos":[{"x":2,"y":85},{"x":509,"y":85},{"x":509,"y":170},{"x":2,"y":170}],"prob":99,"width":84,"word":"いくら飞すか","x":213,"y":-126}],"width":512}
Codestring

状态码

200
Messagestring

详细信息

message

返回数据说明

angle                  图片的角度,0 表示正向,90 表示图片朝右,180 朝下,270 朝左</br>
content              识别出图片的文字块汇总</br>
height                算法矫正图片后的高度</br>
width                 算法矫正图片后的宽度</br>
orgHeight          原图的高度</br>
orgWidth           原图的宽度</br>
prism_wnum      识别的文字块的数量,prism_wordsInfo 数组的大小</br>
-------------------------prism-wordsInfo 文字块数组内的字段说明-------------------------</br>
angle                 文字块的角度,这个角度只影响 width 和 height,当角度为-90、90、-270、270,width 和 height 的值需要自行互换</br>
height                文字块的高度</br>
width                 文字块的宽度</br>
pos                    文字块的外矩形四个点的坐标按顺时针排列,左上、右上、右下、左下,当 NeedRotate 为 true 时,如果最外层的 angle 不为 0,需要按照 angle 矫正图片后,坐标才准确</br>
word                  文字块的文字</br>
tableId               当 OutputTable 为 true 并且该文字块在表格内则存在该字段,tableId 表示表格的 id</br>
tableCellId         当 OutputTable 为 true 并且该文字块在表格内则存在该字段,表示表格中单元格的 id</br>
----------------------------------------charInfo 单字信息-----------------------------------------</br>
word                  单字文字</br>
x                        单字左上角横坐标</br>
y                        单字左上角纵坐标</br>
w                       单字宽度
<span>h                       单字高度</span></br>
--------------------------------------------------------------------------------------------------------</br>
--------------------------------------------------------------------------------------------------------</br>
---------------------------prism-tablesInfo 表格数组内的字段说明--------------------------</br>
tableId               表格 id,和 prism_wordsInfo 信息中的 tableId 对应</br>
xCellSize            表格中横坐标单元格的数量</br>
yCellSize            表格中纵坐标单元格的数量</br>
------------cellInfos 单元格信息,包含单元格在整个表格中的空间拓扑关系---------</br>
tableCellId         表格中单元格 id,和 prism_wordsInfo 信息中的 tableCellId 对应</br>
word                 单元格中的文字</br>
xsc                    xStartCell 缩写,表示横轴方向该单元格起始在第几个单元格,第一个单元格值为 0</br>
xec                    xEndCell 缩写,表示横轴方向该单元格结束在第几个单元格,第一个单元格值为 0,如果 xsc 和 xec 都为 0 说明该文字在横轴方向占据了一个单元格并且在第一个单元格内</br>
ysc                    yStartCell 缩写,表示纵轴方向该单元格起始在第几个单元格,第一个单元格值为 0</br>
yec                    yEndCell 缩写,表示纵轴方向该单元格结束在第几个单元格,第一个单元格值为 0</br>
pos                   单元格位置,按照单元格四个角的坐标顺时针排列,分别为左上 XY 坐标、右上 XY 坐标、右下 XY 坐标、左下 XY 坐标</br>
--------------------------------------------------------------------------------------------------------</br>
--------------------------------------------------------------------------------------------------------</br>

示例

正常返回示例

JSON格式

{
  "RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
  "Data": "{\"content\":\"いくら飞すか (多少钱?) \",\"height\":384,\"orgHeight\":384,\"orgWidth\":512,\"prism_version\":\"1.0.9\",\"prism_wnum\":2,\"prism_wordsInfo\":[{\"angle\":-89,\"direction\":0,\"height\":508,\"pos\":[{\"x\":2,\"y\":85},{\"x\":509,\"y\":85},{\"x\":509,\"y\":170},{\"x\":2,\"y\":170}],\"prob\":99,\"width\":84,\"word\":\"いくら飞すか\",\"x\":213,\"y\":-126}],\"width\":512}",
  "Code": "200",
  "Message": "message"
}

错误码

访问错误中心查看更多错误码。

变更历史

变更时间变更内容概要操作
2021-08-17OpenAPI 入参发生变更查看变更详情