支持各学科的教辅试卷的结构化电子录入,将试卷中的题目进行自动化切分和结构化打标,并进行对应题目、题干、选项、答案等内容的结构化输出。
接口说明
本接口适用场景
- 阿里云试卷切题识别,是阿里云官方自研 OCR 文字识别产品,适用于识别整页练习册、试卷或教辅中的题目的场景,适用于教育材料内容的数字化生产与题库录入。
- 阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,历经多年沉淀打磨,具有服务稳定、操作简易、实时性高、能力全面等几大优势。
- 本接口图片示例

本接口核心能力
| 分类 | 概述 |
|---|---|
| 服务 | 自动切题,并识别其中所包含的文字内容和坐标位置。 |
| 图像增强 | 默认支持图像增强,包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。 |
| 多类型覆盖 | 支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。 |
| 适用范围广 | 支持 K12 全学科、多版式扫描版印刷体的整页切题场景。 |
如何使用本接口
| 步骤 | 概述 |
|---|---|
| 1 | 开通 教育场景识别 服务。开通服务前后,您可以通过体验馆免费体验本功能识别效果。 |
| 2 | 购买试卷切题识别资源包。本 API 会赠送免费额度,可使用免费额度测试。 |
| 3 | 可以参照调试页面提供的代码示例完成 API 接入开发。接入完成后,调用 API 获取识别结果。如果使用子账号调用接口,需要阿里云账号(主账号)对 RAM 账号进行授权。创建 RAM 用户的具体操作,请参考:创建 RAM 用户。文字识别服务提供一种系统授权策略,即 AliyunOCRFullAccess。具体授权操作,请参见在用户页面为 RAM 用户授权。 |
重要提示
| 类型 | 概述 |
|---|---|
| 图片格式 |
|
| 图片尺寸 |
|
| 图片大小 |
|
| 其他提示 |
|
| 相关能力 |
调试
您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。
授权信息
下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:
- 操作:是指具体的权限点。
- 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
- 资源类型:是指操作中支持授权的资源类型。具体说明如下:
- 对于必选的资源类型,用前面加 * 表示。
- 对于不支持资源级授权的操作,用
全部资源表示。
- 条件关键字:是指云产品自身定义的条件关键字。
- 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
| 操作 | 访问级别 | 资源类型 | 条件关键字 | 关联操作 |
|---|---|---|---|---|
| ocr:RecognizeEduPaperCut | get | *全部资源 * |
| 无 |
请求参数
| 名称 | 类型 | 必填 | 描述 | 示例值 |
|---|---|---|---|---|
| Url | string | 否 |
| https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20241223/pjzsaz/%E8%AF%95%E5%8D%B7%E5%88%87%E9%A2%98%E8%AF%86%E5%88%AB.png |
| body | byte | 否 |
| 图片二进制文件 |
| CutType | string | 是 |
| question |
| ImageType | string | 是 |
| scan:扫描图, photo:实拍图 |
| Subject | string | 否 |
| default:默认, Math:数学, PrimarySchool_Math:小学数学, JHighSchool_Math: 初中数学, Chinese:语文, PrimarySchool_Chinese:小学语文, JHighSchool_Chinese:初中语文, English:英语, PrimarySchool_English:小学英语, JHighSchool_English:初中英语, Physics:物理, JHighSchool_Physics:初中物理, Chemistry: 化学, JHighSchool_Chemistry:初中化学, Biology:生物, JHighSchool_Biology:初中生物, History:历史, JHighSchool_History:初中历史, Geography:地理, JHighSchool_Geography:初中地理, Politics:政治, JHighSchool_Politics:初中政治 |
| OutputOricoord | boolean | 否 |
| false |
返回参数
返回参数说明
页面信息(page_list 字段)
| 字段 | 类型 | 说明 |
|---|---|---|
| page_id | int | 页码。 |
| subject_list | list | 题目列表。 |
| doc_index | int | 输入的文档 index,默认从 1 开始。 |
| angle | int | 图片的角度,0 表示正向,90 表示图片朝右,180 朝下,270 朝左。 |
| height | int | 算法矫正图片后的高度。 |
| width | int | 算法矫正图片后的宽度。 |
| orgHeight | int | 原图的高度。 |
| orgWidth | int | 原图的宽度。 |
题目列表信息(subject_list 字段)
| 字段 | 类型 | 说明 |
|---|---|---|
| ids | int | 题号。 |
| ismultipage | boolean | 题目是否跨页。 |
| text | int | 切题后的文字信息,切题包含切题目和答案;可能包含 latex 公式,需要自行解析还原。 |
| prism_wordsInfo | list | 文字块信息。 |
| content_list_info | list | 内容列表。 |
文字块信息(prism_wordsInfo 字段)
| 字段 | 类型 | 说明 |
|---|---|---|
| angle | int | 文字块的角度。 |
| height | int | 文字块的高度(需考虑文字块的角度) |
| width | int | 文字块的宽度(需考虑文字块的角度) |
| pos | list | 文字块的外矩形四个点的坐标按顺时针排列(左上、右上、右下、左下)。 |
| word | string | 文字块的文字内容。 |
内容信息(content_list_info 字段)
| 字段 | 类型 | 说明 |
|---|---|---|
| doc_index | int | 输入的文档 index,默认从 1 开始。 |
| pos | list | 文字块的外矩形四个点的坐标按顺时针排列(左上、右上、右下、左下)。 |
示例
正常返回示例
JSON格式
{
"RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
"Data": {
"page_list": [
{
"angle": 0,
"doc_index": 1,
"height": 7000,
"orgHeight": 7000,
"orgWidth": 4716,
"page_id": -1,
"subject_list": [
{
"content_list_info": [
{
"doc_index": 1,
"pos": [
{
"x": 337,
"y": 1644
},
{
"x": 2313,
"y": 1641
},
{
"x": 2313,
"y": 2234
},
{
"x": 337,
"y": 2234
}
]
}
],
"ids": [
1
],
"is_multipage": false,
"prism_wordsInfo": [
{
"pos": [
{
"x": 337,
"y": 1644
},
{
"x": 2313,
"y": 1641
},
{
"x": 2313,
"y": 1715
},
{
"x": 337,
"y": 1719
}
],
"word": "1.[2017·高密期末]三角形按角分类可以分为()"
},
{
"pos": [
{
"x": 462,
"y": 1777
},
{
"x": 1925,
"y": 1774
},
{
"x": 1925,
"y": 1846
},
{
"x": 462,
"y": 1849
}
],
"word": "A.锐角三角形、直角三角形、钝角三角形"
},
{
"pos": [
{
"x": 456,
"y": 1904
},
{
"x": 2004,
"y": 1904
},
{
"x": 2004,
"y": 1976
},
{
"x": 456,
"y": 1976
}
],
"word": "B.等腰三角形、等边三角形、不等边三角形"
},
{
"pos": [
{
"x": 456,
"y": 2034
},
{
"x": 1633,
"y": 2033
},
{
"x": 1633,
"y": 2104
},
{
"x": 456,
"y": 2105
}
],
"word": "C.直角三角形、等腰直角三角形"
},
{
"pos": [
{
"x": 453,
"y": 2164
},
{
"x": 1261,
"y": 2164
},
{
"x": 1261,
"y": 2233
},
{
"x": 453,
"y": 2234
}
],
"word": "D.以上答案都不正确"
}
],
"text": "1.[2017·高密期末]三角形按角分类可以分为( ) A.锐角三角形、直角三角形、钝角三角形B. 等腰三角形、等边三角形、不等边三角形C.直角三角形、等腰直角三角形D.以上答案都不正确"
}
],
"width": 4716
}
]
},
"Code": "noPermission",
"Message": "You are not authorized to perform this operation."
}错误码
访问错误中心查看更多错误码。
变更历史
| 变更时间 | 变更内容概要 | 操作 |
|---|---|---|
| 2024-07-31 | OpenAPI 入参发生变更 | 查看变更详情 |
| 2021-08-17 | OpenAPI 入参发生变更 | 查看变更详情 |
