文档

RecognizeEduPaperCut - 试卷切题识别

更新时间:

试卷切题识别。

接口说明

本接口适用场景

  • 阿里云试卷切题识别,是阿里云官方自研 OCR 文字识别产品,适用于识别整页练习册、试卷或教辅中的题目的场景,适用于教育材料内容的数字化生产与题库录入。
  • 阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,历经多年沉淀打磨,具有服务稳定、操作简易、实时性高、能力全面等几大优势。
  • 本接口图片示例

本接口核心能力

分类概述
服务自动切题,并识别其中所包含的文字内容和坐标位置。
图像增强默认支持图像增强,包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。
多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。
适用范围广支持 K12 全学科、多版式扫描版印刷体的整页切题场景。

如何使用本接口

步骤概述
1开通 教育场景识别 服务。开通服务前后,您可以通过体验馆免费体验本功能识别效果。
2购买试卷切题识别资源包。本 API 会赠送免费额度,可使用免费额度测试。
3可以参照调试页面提供的代码示例完成 API 接入开发。接入完成后,调用 API 获取识别结果。如果使用子账号调用接口,需要阿里云账号(主账号)对 RAM 账号进行授权。创建 RAM 用户的具体操作,请参考:创建 RAM 用户。文字识别服务提供一种系统授权策略,即 AliyunOCRFullAccess。具体授权操作,请参见在用户页面为 RAM 用户授权。

重要提示

类型概述
图片格式
  • 本接口支持:PNG、JPG、JPEG、BMP、GIF、TIFF、WebP。暂不支持 PDF 格式。
图片尺寸
  • 图片长宽需要大于 15 像素,小于 8192 像素。
  • 长宽比需要小于 50。
  • 如需达到较好识别效果,建议长宽均大于 500px。
图片大小
  • 图片二进制文件不能超过 10MB。
  • URL 长度不能超过 2048。
  • 图片过大会影响接口响应速度,建议使用小于 1.5M 图片进行识别,且通过传图片 URL 的方式调用接口。
  • 图片尺寸过小,会影响识别精度。图片内单字大小在 10-50px 内时,识别效果较好。
其他提示
  • 接口响应速度和图片中的文字数量有关,如果图片中文字数量越多,接口响应可能越慢。
  • 接口会自动处理反光、扭曲等干扰信息,但会影响精度。请尽量选择清晰度高、无反光、无扭曲的图片。
相关能力

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

授权信息

下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:

  • 操作:是指具体的权限点。
  • 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
  • 资源类型:是指操作中支持授权的资源类型。具体说明如下:
    • 对于必选的资源类型,用背景高亮的方式表示。
    • 对于不支持资源级授权的操作,用全部资源表示。
  • 条件关键字:是指云产品自身定义的条件关键字。
  • 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
操作访问级别资源类型条件关键字关联操作
ocr:RecognizeEduPaperCutWrite
  • 全部资源
    *

请求参数

名称类型必填描述示例值
Urlstring
  • 本字段和 body 字段二选一,不可同时透传或同时为空。
  • 图片链接(长度不超 2048,不支持 base64)。
https://img.alicdn.com/tfs/TB1Wo7eXAvoK1RjSZFDXXXY3pXa-2512-3509.jpg
bodybyte
  • 本字段和 URL 字段二选一,不可同时透传或同时为空。
  • 图片二进制文件,最大 10MB。
  • 使用 HTTP 方式调用,把图片二进制文件放到 HTTP body 中上传即可。
  • 使用 SDK 的方式调用,把图片放到 SDK 的 body 中即可。
图片二进制文件
CutTypestring
  • 切题类型。
  • question:题目, answer:答案。
question
ImageTypestring
  • 图片类型。
  • scan:扫描图, photo:实拍图。
scan:扫描图, photo:实拍图
Subjectstring
  • 年级学科。
  • default:默认, Math:数学, PrimarySchool_Math:小学数学, JHighSchool_Math: 初中数学, Chinese:语文, PrimarySchool_Chinese:小学语文, JHighSchool_Chinese:初中语文, English:英语, PrimarySchool_English:小学英语, JHighSchool_English:初中英语, Physics:物理, JHighSchool_Physics:初中物理, Chemistry: 化学, JHighSchool_Chemistry:初中化学, Biology:生物, JHighSchool_Biology:初中生物, History:历史, JHighSchool_History:初中历史, Geography:地理, JHighSchool_Geography:初中地理, Politics:政治, JHighSchool_Politics:初中政治。
default:默认, Math:数学, PrimarySchool_Math:小学数学, JHighSchool_Math: 初中数学, Chinese:语文, PrimarySchool_Chinese:小学语文, JHighSchool_Chinese:初中语文, English:英语, PrimarySchool_English:小学英语, JHighSchool_English:初中英语, Physics:物理, JHighSchool_Physics:初中物理, Chemistry: 化学, JHighSchool_Chemistry:初中化学, Biology:生物, JHighSchool_Biology:初中生物, History:历史, JHighSchool_History:初中历史, Geography:地理, JHighSchool_Geography:初中地理, Politics:政治, JHighSchool_Politics:初中政治

返回参数

名称类型描述示例值
object

Schema of Response

RequestIdstring

请求唯一 ID

43A29C77-405E-4CC0-BC55-EE694AD00655
Datastring

返回数据

{"page_list":[{"angle":0,"doc_index":1,"height":7000,"orgHeight":7000,"orgWidth":4716,"page_id":-1,"subject_list":[{"content_list_info":[{"doc_index":1,"pos":[{"x":337,"y":1644},{"x":2313,"y":1641},{"x":2313,"y":2234},{"x":337,"y":2234}]}],"ids":["1"],"is_multipage":false,"prism_wordsInfo":[{"pos":[{"x":337,"y":1644},{"x":2313,"y":1641},{"x":2313,"y":1715},{"x":337,"y":1719}],"word":"1.[2017·高密期末]三角形按角分类可以分为()"},{"pos":[{"x":462,"y":1777},{"x":1925,"y":1774},{"x":1925,"y":1846},{"x":462,"y":1849}],"word":"A.锐角三角形、直角三角形、钝角三角形"},{"pos":[{"x":456,"y":1904},{"x":2004,"y":1904},{"x":2004,"y":1976},{"x":456,"y":1976}],"word":"B.等腰三角形、等边三角形、不等边三角形"},{"pos":[{"x":456,"y":2034},{"x":1633,"y":2033},{"x":1633,"y":2104},{"x":456,"y":2105}],"word":"C.直角三角形、等腰直角三角形"},{"pos":[{"x":453,"y":2164},{"x":1261,"y":2164},{"x":1261,"y":2233},{"x":453,"y":2234}],"word":"D.以上答案都不正确"}],"text":"1.[2017·高密期末]三角形按角分类可以分为( ) A.锐角三角形、直角三角形、钝角三角形B. 等腰三角形、等边三角形、不等边三角形C.直角三角形、等腰直角三角形D.以上答案都不正确"}],"width":4716}]}
Codestring

状态码(如果识别成功,不会返回此字段)

如果识别成功,不会返回此字段
Messagestring

详细信息(如果识别成功,不会返回此字段)

如果识别成功,不会返回此字段

返回参数说明


页面信息(page_list 字段)

字段类型说明
page_idint页码。
subject_listlist题目列表。
doc_indexint输入的文档 index,默认从 1 开始。
angleint图片的角度,0 表示正向,90 表示图片朝右,180 朝下,270 朝左。
heightint算法矫正图片后的高度。
widthint算法矫正图片后的宽度。
orgHeightint原图的高度。
orgWidthint原图的宽度。

题目列表信息(subject_list 字段)

字段类型说明
idsint题号。
ismultipageboolean题目是否跨页。
textint切题后的文字信息,切题包含切题目和答案;可能包含 latex 公式,需要自行解析还原。
prism_wordsInfolist文字块信息。
content_list_infolist内容列表。

文字块信息(prism_wordsInfo 字段)

字段类型说明
angleint文字块的角度。
heightint算法矫正图片后的高度。
widthint算法矫正图片后的宽度。
poslist文字块的外矩形四个点的坐标按顺时针排列(左上、右上、右下、左下)。
wordstring文字块的文字内容。

内容信息(content_list_info 字段)

字段类型说明
doc_indexint输入的文档 index,默认从 1 开始。
poslist文字块的外矩形四个点的坐标按顺时针排列(左上、右上、右下、左下)。

示例

正常返回示例

JSON格式

{
  "RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
  "Data": "{\"page_list\":[{\"angle\":0,\"doc_index\":1,\"height\":7000,\"orgHeight\":7000,\"orgWidth\":4716,\"page_id\":-1,\"subject_list\":[{\"content_list_info\":[{\"doc_index\":1,\"pos\":[{\"x\":337,\"y\":1644},{\"x\":2313,\"y\":1641},{\"x\":2313,\"y\":2234},{\"x\":337,\"y\":2234}]}],\"ids\":[\"1\"],\"is_multipage\":false,\"prism_wordsInfo\":[{\"pos\":[{\"x\":337,\"y\":1644},{\"x\":2313,\"y\":1641},{\"x\":2313,\"y\":1715},{\"x\":337,\"y\":1719}],\"word\":\"1.[2017·高密期末]三角形按角分类可以分为()\"},{\"pos\":[{\"x\":462,\"y\":1777},{\"x\":1925,\"y\":1774},{\"x\":1925,\"y\":1846},{\"x\":462,\"y\":1849}],\"word\":\"A.锐角三角形、直角三角形、钝角三角形\"},{\"pos\":[{\"x\":456,\"y\":1904},{\"x\":2004,\"y\":1904},{\"x\":2004,\"y\":1976},{\"x\":456,\"y\":1976}],\"word\":\"B.等腰三角形、等边三角形、不等边三角形\"},{\"pos\":[{\"x\":456,\"y\":2034},{\"x\":1633,\"y\":2033},{\"x\":1633,\"y\":2104},{\"x\":456,\"y\":2105}],\"word\":\"C.直角三角形、等腰直角三角形\"},{\"pos\":[{\"x\":453,\"y\":2164},{\"x\":1261,\"y\":2164},{\"x\":1261,\"y\":2233},{\"x\":453,\"y\":2234}],\"word\":\"D.以上答案都不正确\"}],\"text\":\"1.[2017·高密期末]三角形按角分类可以分为( ) A.锐角三角形、直角三角形、钝角三角形B. 等腰三角形、等边三角形、不等边三角形C.直角三角形、等腰直角三角形D.以上答案都不正确\"}],\"width\":4716}]}",
  "Code": "如果识别成功,不会返回此字段",
  "Message": "如果识别成功,不会返回此字段"
}

错误码

访问错误中心查看更多错误码。

变更历史

变更时间变更内容概要操作
2021-08-17OpenAPI 入参发生变更看变更集
变更项变更内容
入参OpenAPI 入参发生变更
    新增入参:body
  • 本页导读 (0)
文档反馈