RecognizeEduPaperOcr - 整页试卷识别

整页试卷识别。

接口说明

本接口适用场景

  • 阿里云整页试卷识别,是阿里云官方自研OCR文字识别产品,适用于对练习册、教辅、教材等内容进行整页识别与题目检索场景。
  • 阿里云OCR产品基于阿里巴巴达摩院强大的AI技术及海量数据,历经多年沉淀打磨,具有服务稳定、操作简易、实时性高、能力全面等几大优势。
  • 本接口图片示例

本接口核心能力

分类概述
图像增强默认支持图像增强,包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。
多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。
高精度识别总体识别准确率可达97%。

如何使用本接口

步骤概述
1开通 教育场景识别 服务。开通服务前后,您可以通过体验馆免费体验本功能识别效果。
2购买教育场景识别资源包。本API会赠送免费额度,可使用免费额度测试。
3可以参照调试页面提供的代码示例完成API接入开发。接入完成后,调用API获取识别结果。如果使用子账号调用接口,需要阿里云账号(主账号)对RAM账号进行授权。创建RAM用户的具体操作,请参考:创建RAM用户。文字识别服务提供一种系统授权策略,即AliyunOCRFullAccess。具体授权操作,请参见在用户页面为RAM用户授权。

重要提示

类型概述
图片格式
  • 本接口支持:PNG、JPG、JPEG、BMP、GIF、TIFF、WebP。暂不支持PDF格式。
图片尺寸
  • 图片长宽需要大于15像素,小于8192像素。
  • 长宽比需要小于50。
  • 如需达到较好识别效果,建议长宽均大于500px。
图片大小
  • 图片二进制文件不能超过10MB。
  • 图片过大会影响接口响应速度,建议使用小于1.5M图片进行识别,且通过传图片URL的方式调用接口。
其他提示
  • 接口响应速度和图片中的文字数量有关,如果图片中文字数量越多,接口响应可能越慢。
  • 接口会自动处理反光、扭曲等干扰信息,但会影响精度。请尽量选择清晰度高、无反光、无扭曲的图片。

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

调试

授权信息

下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:

  • 操作:是指具体的权限点。
  • 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
  • 资源类型:是指操作中支持授权的资源类型。具体说明如下:
    • 对于必选的资源类型,用背景高亮的方式表示。
    • 对于不支持资源级授权的操作,用全部资源表示。
  • 条件关键字:是指云产品自身定义的条件关键字。
  • 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
操作访问级别资源类型条件关键字关联操作
ocr:RecognizeEduPaperOcrWrite
  • OCR
    acs:ocr::{#accountId}:*

请求参数

名称类型必填描述示例值
Urlstring
  • 本字段和body字段二选一,不可同时透传或同时为空。
  • 图片链接(长度不超2048,不支持base64)。
https://img.alicdn.com/tfs/TB1Wo7eXAvoK1RjSZFDXXXY3pXa-2512-3509.jpg
bodybyte
  • 本字段和URL字段二选一,不可同时透传或同时为空。
  • 图片二进制文件,最大10MB。
  • 使用HTTP方式调用,把图片二进制文件放到HTTP body中上传即可。
  • 使用SDK的方式调用,把图片放到SDK的body中即可。
图片二进制文件
ImageTypestring
  • 图片类型。
  • scan:扫描图, photo:实拍图。
scan:扫描图, photo:实拍图
Subjectstring
  • 年级学科。
  • default:默认, Math:数学, PrimarySchool_Math:小学数学, JHighSchool_Math: 初中数学, Chinese:语文, PrimarySchool_Chinese:小学语文, JHighSchool_Chinese:初中语文, English:英语, PrimarySchool_English:小学英语, JHighSchool_English:初中英语, Physics:物理, JHighSchool_Physics:初中物理, Chemistry: 化学, JHighSchool_Chemistry:初中化学, Biology:生物, JHighSchool_Biology:初中生物, History:历史, JHighSchool_History:初中历史, Geography:地理, JHighSchool_Geography:初中地理, Politics:政治, JHighSchool_Politics:初中政治。
default:默认, Math:数学, PrimarySchool_Math:小学数学, JHighSchool_Math: 初中数学, Chinese:语文, PrimarySchool_Chinese:小学语文, JHighSchool_Chinese:初中语文, English:英语, PrimarySchool_English:小学英语, JHighSchool_English:初中英语, Physics:物理, JHighSchool_Physics:初中物理, Chemistry: 化学, JHighSchool_Chemistry:初中化学, Biology:生物, JHighSchool_Biology:初中生物, History:历史, JHighSchool_History:初中历史, Geography:地理, JHighSchool_Geography:初中地理, Politics:政治, JHighSchool_Politics:初中政治
OutputOricoordboolean
  • 是否输出原图坐标信息(如果图片被做过旋转,图片校正等处理),默认不需要。
  • true:需要;false:不需要。
false

返回参数

名称类型描述示例值
object

Schema of Response

RequestIdstring

请求唯一 ID

43A29C77-405E-4CC0-BC55-EE694AD00655
Datastring

返回数据

{"content":"√技能提升练 √拓展创新练 12.对于同一平面内的三条直线,给出下列5个论断: 15.「2018春·如皋期末]在一个","figure":[{"type":"subject_pattern","x":1605,"y":3087,"w":645,"h":804,"box":{"x":0,"y":0,"w":0,"h":0,"angle":0},"points":[{"x":1605,"y":3087},{"x":2250,"y":3087},{"x":2250,"y":3891},{"x":1605,"y":3891}]}],"height":7000,"orgHeight":7000,"orgWidth":4716,"prism_version":"1.0.9","prism_wnum":64,"prism_wordsInfo":[{"angle":0,"direction":0,"height":85,"pos":[{"x":207,"y":508},{"x":826,"y":506},{"x":826,"y":592},{"x":208,"y":594}],"prob":96,"recClassify":0,"width":618,"word":"√技能提升练","x":207,"y":506}],"width":4716}
Codestring

状态码

200
Messagestring

详细信息

message

返回参数说明


字段类型说明
angleint图片的角度。0表示正向,90表示图片朝右,180朝下,270朝左。
contentstring识别出图片的文字块汇总,可能包含latex公式,需要自行解析还原。
figurelist图片中的图案信息。
prism_wordsInfolist文字块信息。
prism_wnumint识别的文字块的数量,prism_wordsInfo数组的大小。
heightint算法矫正图片后的高度。
widthint算法矫正图片后的宽度。
orgHeightint原图的高度。
orgWidthint原图的宽度。

文字块信息(prism_wordsInfo字段)

字段类型说明
angleint文字块的角度。
heightint算法矫正图片后的高度。
widthint算法矫正图片后的宽度。
poslist文字块的外矩形四个点的坐标按顺时针排列(左上、右上、右下、左下)。当NeedRotate=true时,如果最外层的angle不为0,需要按照angle矫正图片后,坐标才准确。
wordstring文字块的文字内容。
tableIdint表格的id(当OutputTable=true时,返回此字段)。
tableCellIdint表格中单元格的id(当OutputTable=true时,返回此字段)。
charInfolist单字信息。

单字信息(charInfo字段)

字段类型说明
wordstring单字文字。
probint置信度。
recClassifyint文字属性分类。(0:中文印刷,1:拉丁语种,2:手写体,3:韩语,4:泰文,51:公式)
xint单字左上角横坐标。
yint单字左上角纵坐标。
wint单字宽度。
hint单字高度。

图案位置信息(figure字段)

字段类型说明
typestring图案类型。
xint图案左上角横坐标。
yint图案左上角纵坐标。
wint图案宽度。
hint图案高度。
boxobject图案坐标信息:中心横纵坐标,长宽,顺时针旋转角度。定义同 OpenCV 中 RotatedRect,请参见 OpenCV 文档
pointslist图案四个点坐标(左上、右上、右下、左下)。

示例

正常返回示例

JSON格式

{
  "RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
  "Data": "{\"content\":\"√技能提升练 √拓展创新练 12.对于同一平面内的三条直线,给出下列5个论断: 15.「2018春·如皋期末]在一个\",\"figure\":[{\"type\":\"subject_pattern\",\"x\":1605,\"y\":3087,\"w\":645,\"h\":804,\"box\":{\"x\":0,\"y\":0,\"w\":0,\"h\":0,\"angle\":0},\"points\":[{\"x\":1605,\"y\":3087},{\"x\":2250,\"y\":3087},{\"x\":2250,\"y\":3891},{\"x\":1605,\"y\":3891}]}],\"height\":7000,\"orgHeight\":7000,\"orgWidth\":4716,\"prism_version\":\"1.0.9\",\"prism_wnum\":64,\"prism_wordsInfo\":[{\"angle\":0,\"direction\":0,\"height\":85,\"pos\":[{\"x\":207,\"y\":508},{\"x\":826,\"y\":506},{\"x\":826,\"y\":592},{\"x\":208,\"y\":594}],\"prob\":96,\"recClassify\":0,\"width\":618,\"word\":\"√技能提升练\",\"x\":207,\"y\":506}],\"width\":4716}",
  "Code": "200",
  "Message": "message"
}

错误码

访问错误中心查看更多错误码。

变更历史

变更时间变更内容概要操作
2021-08-17OpenAPI 入参发生变更
变更项变更内容
入参OpenAPI 入参发生变更
    新增入参:body
阿里云首页 印刷文字识别 相关技术圈