可对题目进行有效识别。通过对题目的元素进行打标,提升题目的识别效果。
接口说明
本接口适用场景
- 阿里云题目识别,是阿里云官方自研 OCR 文字识别产品,适用于扫描、拍照场景的单题题目识别,适用于智能批改等场景的题目内容识别。
- 阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,历经多年沉淀打磨,具有服务稳定、操作简易、实时性高、能力全面等几大优势。
- 本接口图片示例

本接口核心能力
| 分类 | 概述 | 
|---|---|
| 多文本格式 | 支持印刷体文本以及公式的 OCR 识别。 | 
| 图像增强 | 默认支持图像增强,包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。 | 
| 多类型覆盖 | 支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。 | 
| 返回坐标 | 可实现对题目中的配图位置进行检测并返回坐标位置。 | 
如何使用本接口
| 步骤 | 概述 | 
|---|---|
| 1 | 开通 教育场景识别 服务。开通服务前后,您可以通过体验馆免费体验本功能识别效果。 | 
| 2 | 购买题目识别资源包。本 API 会赠送免费额度,可使用免费额度测试。 | 
| 3 | 可以参照调试页面提供的代码示例完成 API 接入开发。接入完成后,调用 API 获取识别结果。如果使用子账号调用接口,需要阿里云账号(主账号)对 RAM 账号进行授权。创建 RAM 用户的具体操作,请参考:创建 RAM 用户。文字识别服务提供一种系统授权策略,即 AliyunOCRFullAccess。具体授权操作,请参见在用户页面为 RAM 用户授权。 | 
重要提示
| 类型 | 概述 | 
|---|---|
| 图片格式 | 
 | 
| 图片尺寸 | 
 | 
| 图片大小 | 
 | 
| 其他提示 | 
 | 
调试
您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。
授权信息
下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:
- 操作:是指具体的权限点。
- 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
- 资源类型:是指操作中支持授权的资源类型。具体说明如下:- 对于必选的资源类型,用前面加 * 表示。
- 对于不支持资源级授权的操作,用全部资源表示。
 
- 条件关键字:是指云产品自身定义的条件关键字。
- 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
| 操作 | 访问级别 | 资源类型 | 条件关键字 | 关联操作 | 
|---|---|---|---|---|
| ocr:RecognizeEduQuestionOcr | *全部资源 * | 
 | 无 | 
请求参数
| 名称 | 类型 | 必填 | 描述 | 示例值 | 
|---|---|---|---|---|
| Url | string | 否 | 
 | https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20241223/yyrzrb/%E9%A2%98%E7%9B%AE%E8%AF%86%E5%88%AB.png | 
| body | byte | 否 | 
 | 图片二进制文件 | 
| NeedRotate | boolean | 否 | 
 | false | 
返回参数
返回参数说明
| 字段 | 类型 | 说明 | 
|---|---|---|
| content | string | 识别出图片的文字块汇总。 | 
| figure | list | 图片中的图案信息。 | 
| prism_wordsInfo | list | 文字块信息。 | 
| prism_wnum | int | 识别的文字块的数量,prism_wordsInfo 数组的大小。 | 
| height | int | 算法矫正图片后的高度。 | 
| width | int | 算法矫正图片后的宽度。 | 
| orgHeight | int | 原图的高度。 | 
| orgWidth | int | 原图的宽度。 | 
文字块信息(prism_wordsInfo 字段)
| 字段 | 类型 | 说明 | 
|---|---|---|
| angle | int | 文字块的角度。 | 
| height | int | 文字块的高度(需考虑文字块的角度) | 
| width | int | 文字块的宽度(需考虑文字块的角度) | 
| pos | list | 文字块的外矩形四个点的坐标按顺时针排列(左上、右上、右下、左下)。 | 
| word | string | 文字块的文字内容。 | 
| charInfo | list | 单字信息。 | 
| recClassify | int | 文字属性分类。(0:“中文印刷”,1:“拉丁语种”,2:“手写体”,3:“韩语”,4:“泰文”,51:“公式”)。 | 
单字信息(charInfo 字段)
| 字段 | 类型 | 说明 | 
|---|---|---|
| word | string | 单字文字。 | 
| prob | int | 置信度。 | 
| x | int | 单字左上角横坐标。 | 
| y | int | 单字左上角纵坐标。 | 
| w | int | 单字宽度。 | 
| h | int | 单字高度。 | 
图案位置信息(figure 字段)
| 字段 | 类型 | 说明 | 
|---|---|---|
| type | string | 图案类型。 | 
| x | int | 图案左上角横坐标。 | 
| y | int | 图案左上角纵坐标。 | 
| w | int | 图案宽度。 | 
| h | int | 图案高度。 | 
| box | object | 图案坐标信息:中心横纵坐标,长宽,顺时针旋转角度。定义同 OpenCV 中 RotatedRect,请参见 OpenCV 文档。 | 
| points | list | 图案四个点坐标(左上、右上、右下、左下)。 | 
示例
正常返回示例
JSON格式
{
  "RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
  "Data": "{\n      \"content\": \"√技能提升练 √拓展创新练 12.对于同一平面内的三条直线,给出下列5个论断:15.「2018春·如皋期末]在一个三角形中,如果一个角 ①a//b;②b∥c;③a⊥b;④a∥c;⑤a⊥c ,以其中两是另一个角的3倍,这样的三角形我们称之为“智个论断为条件,一个论断为结论,组成一个你认为慧三角形”.如三个内角分别为 1 2 0 ^ { \\\\circ } , 4 0 ^ { \\\\circ } , 2 0 ^ { \\\\circ } 的三角正确的命题. 形是“智慧三角形”. 已知:,结论: 如图 1 - 2 - 2 , \\\\angle M O N = 6 0 ^ { \\\\circ } , 在射线OM上找一点 13.指出命题“同旁内角互补”的条件和结论,并说明这 A,过点A作 AB⊥OM 交ON于点B,以A为端点个命题是正确的命题还是错误的命题. 作射线AD 交射线OB于点C(点C不与点O重合). M A B N 图 1- -2一2 14.如图 1-2-1, 点B,A,E在同一条直线上,已知①AD (1) ∠ABC 的度数为°, △AOB ∥BC,②∠B=∠C,③AD 平分 ∠EAC. 请你用其中两(填“是”或“不是”)智慧三角形; 个作为条件,另一个作为结论,构造命题,并说明你构 (2)若 \\\\angle O A C = 2 0 ^ { \\\\circ } ,试说明::△AOC 为\"智慧三角形的命题是正确的命题还是错误的命题. 形”; E D B C 图 1-2-1 (3)当 △ABC 为“智慧三角形”时,求 ∠OAC 的度数. 第1章三角形的初步知识A5 \",\n      \"figure\": [\n            {\n                  \"type\": \"subject_pattern\",\n                  \"x\": 1605,\n                  \"y\": 3087,\n                  \"w\": 645,\n                  \"h\": 804,\n                  \"box\": {\n                        \"x\": 0,\n                        \"y\": 0,\n                        \"w\": 0,\n                        \"h\": 0,\n                        \"angle\": 0\n                  },\n                  \"points\": [\n                        {\n                              \"x\": 1605,\n                              \"y\": 3087\n                        },\n                        {\n                              \"x\": 2250,\n                              \"y\": 3087\n                        },\n                        {\n                              \"x\": 2250,\n                              \"y\": 3891\n                        },\n                        {\n                              \"x\": 1605,\n                              \"y\": 3891\n                        }\n                  ]\n            }\n      ],\n      \"height\": 7000,\n      \"orgHeight\": 7000,\n      \"orgWidth\": 4716,\n      \"prism_version\": \"1.0.9\",\n      \"prism_wnum\": 64,\n      \"prism_wordsInfo\": [\n            {\n                  \"angle\": 0,\n                  \"direction\": 0,\n                  \"height\": 85,\n                  \"pos\": [\n                        {\n                              \"x\": 207,\n                              \"y\": 508\n                        },\n                        {\n                              \"x\": 826,\n                              \"y\": 506\n                        },\n                        {\n                              \"x\": 826,\n                              \"y\": 592\n                        },\n                        {\n                              \"x\": 208,\n                              \"y\": 594\n                        }\n                  ],\n                  \"prob\": 96,\n                  \"recClassify\": 0,\n                  \"width\": 618,\n                  \"word\": \"√技能提升练\",\n                  \"x\": 207,\n                  \"y\": 506\n            }\n      ],\n      \"width\": 4716\n}",
  "Code": "noPermission",
  "Message": "You are not authorized to perform this operation."
}错误码
访问错误中心查看更多错误码。
变更历史
| 变更时间 | 变更内容概要 | 操作 | 
|---|---|---|
| 2021-08-17 | OpenAPI 入参发生变更 | 查看变更详情 | 
