对文档信息进行结构化识别,并提供元素平铺和层级树两种视角的版面信息输出。能够将文档中的文字元素(单字、文字块、行等)和相应的版面格式(标题、段落、表格)抽离并按顺序输出。
调试
您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。
授权信息
下表是API对应的授权信息,可以在RAM权限策略语句的Action
元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:
- 操作:是指具体的权限点。
- 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
- 资源类型:是指操作中支持授权的资源类型。具体说明如下:
- 对于必选的资源类型,用背景高亮的方式表示。
- 对于不支持资源级授权的操作,用
全部资源
表示。
- 条件关键字:是指云产品自身定义的条件关键字。
- 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
操作 | 访问级别 | 资源类型 | 条件关键字 | 关联操作 |
---|---|---|---|---|
ocr:RecognizeDocumentStructure |
|
| 无 |
请求参数
名称 | 类型 | 必填 | 描述 | 示例值 |
---|---|---|---|---|
Url | string | 否 | 图片链接(长度不超 2048,不支持 base64)。 | https://img.alicdn.com/imgextra/i4/O1CN01amMFBF1GUki3NHNzI_!!6000000000626-2-tps-978-1346.png |
body | byte | 否 | 图片二进制文件,最大 10MB,与 URL 二选一。 使用 HTTP 方式调用,把图片二进制文件放到 HTTP body 中上传即可。 使用 SDK 的方式调用,把图片放到 SDK 的 body 中即可。 | 图片二进制文件 |
NeedRotate | boolean | 否 | 是否需要自动旋转功能,返回角度信息。默认不需要。true:需要 false:不需要。 | false |
OutputCharInfo | boolean | 否 | 是否输出单字识别结果,默认不需要。true:需要 false:不需要。 当 UseNewStyleOutput=true 时,此参数不生效。 | false |
OutputTable | boolean | 否 | 是否输出表格识别结果,包含单元格信息。默认不需要。true:需要 false:不需要。 | false |
NeedSortPage | boolean | 否 | 是否按顺序输出文字块,默认不需要。true:需要 false:不需要。false 表示从左往右,从上到下的顺序;true 表示从上到下,从左往右的顺序。 当 UseNewStyleOutput=true 时,此参数不生效。 | false |
Page | boolean | 否 | 是否需要分页功能,默认不需要。 true:需要 false:不需要。 当 UseNewStyleOutput=true 时,此参数不生效。 | false |
NoStamp | boolean | 否 | 是否需要去除印章功能,默认不需要。true:需要 false:不需要 | false |
Paragraph | boolean | 否 | 是否需要分段功能,默认不需要。true:需要 false:不需要。 当 UseNewStyleOutput=true 时,此参数不生效。 | false |
Row | boolean | 否 | 是否需要成行返回功能,默认不需要。true:需要 false:不需要。 当 UseNewStyleOutput=true 时,此参数不生效。 | false |
UseNewStyleOutput | boolean | 否 | 是否返回新版格式输出,默认为 false | false |
支持的图片格式
- PNG、JPG、JPEG、BMP、GIF、TIFF、WebP
- PDF 文件格式的文档结构化解析请点击文档智能解析快速了解
返回参数
返回字段补充说明
第一种返回格式(UseNewStyleOutput=false)
angle 图片的角度,当 NeedRotate 为 true 时才会返回,0 表示正向,90 表示图片朝右,180 朝下,270 朝左
content 识别出图片的文字块汇总
height 算法矫正图片后的高度
width 算法矫正图片后的宽度
orgHeight 原图的高度
orgWidth 原图的宽度
prism_wnum 识别的文字块的数量,prism_wordsInfo 数组的大小
--------------------------prism-wordsInfo 文字块数组内的字段说明--------------------------
angle 文字块的角度,这个角度只影响 width 和 height,当角度为-90、90、-270、270,width 和 height 的值需要自行互换
height 文字块的高度
width 文字块的宽度
pos 文字块的外矩形四个点的坐标按顺时针排列,左上、右上、右下、左下
word 文字块内容
tableId 当 OutputTable 为 true 并且该文字块在表格内则存在该字段,tableId 表示表格的 id
tableCellId 当 OutputTable 为 true 并且该文字块在表格内则存在该字段,表示表格中单元格的 id
-----------------------------------------charInfo 单字信息-------------------------------------------
word 单字文字
prob 置信度
x 单字左上角横坐标
y 单字左上角纵坐标
w 单字宽度
h 单字高度
-----------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------
----------------------------prism-tablesInfo 表格数组内的字段说明---------------------------
tableId 表格 id,和 prism_wordsInfo 信息中的 tableId 对应
xCellSize 表格中横坐标单元格的数量
yCellSize 表格中纵坐标单元格的数量
-------------cellInfos 单元格信息,包含单元格在整个表格中的空间拓扑关系-----------
tableCellId 表格中单元格 id,和 prism_wordsInfo 信息中的 tableCellId 对应
word 单元格中的文字
xsc xStartCell 缩写,表示横轴方向该单元格起始在第几个单元格,第一个单元格值为 0
xec xEndCell 缩写,表示横轴方向该单元格结束在第几个单元格,第一个单元格值为 0,如果 xsc 和 xec 都为 0 说明该文字在横轴方向占据了一个单元格并且在第一个单元格内
ysc yStartCell 缩写,表示纵轴方向该单元格起始在第几个单元格,第一个单元格值为 0
yec yEndCell 缩写,表示纵轴方向该单元格结束在第几个单元格,第一个单元格值为 0
pos 单元格位置,按照单元格四个角的坐标顺时针排列,分别为左上 XY 坐标、右上 XY 坐标、右下 XY 坐标、左下 XY 坐标
------------------------------------------------------------------------------------
第二种返回格式(UseNewStyleOutput=true)
docInfo 文档信息
layouts 版面信息列表
version doc-json 版本信息
----------------------------------------docInfo 中的字段----------------------------------------
pages 文档页面列表
imageWidth 页面转图后的宽
imageHeight 页面转图后的高
pageIdAllDocs 页面在所有文档的页索引
pageIdCurDoc 页面在当前文档的页索引
----------------------------------------layouts 中的字段----------------------------------------
alignment 间距枚举(LEFT、CENTER、RIGHT、BOTH)
blocks 字块信息列表
text 文本内容
firstLinesChars 文字首行缩进
index 版面阅读顺序
lineHeight 行平均高度
pageNum 单元格所在页数
pos 文字块的外矩形四个点的坐标按顺时针排列,左上、右上、右下、左下
type 版面类型(title:标题、table:表格、table_name:表格名、table_note:表注、multicolumn:多栏文字、formula:公式、contents_title:目录标题、contents:目录主体、text:普通文字、figure:图表、foot:页脚、head:页眉、side:侧栏)
uniqueId 版面信息唯一 id
numCol 表格总列数
numRow 表格总行数
cells 单元格信息
示例
正常返回示例
JSON
格式
{
"RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
"Data": "{\"algo_version\": \"\", \"angle\": 0, \"content\": \"1.1技术方案设计贵公司进行防磨喷涂的锅炉均为循环流化床锅炉,作为一种新型燃烧技术,由于炉型结构和设计参数等特点,在环保性能、燃烧效率、燃料适应性、高效脱硫及灰渣综合利用等方法,具有很大的优越性。然而, CFB锅炉受热面的磨损问题十分严重,贵公司决定采用超音速电弧金属喷涂技术来解决锅炉受热面磨损问题,以减少锅炉的非计划停运。我公司技术服务组根据全国各电厂的防磨防护情况,针对锅炉运行的详细状况、工艺参数以及失效因素,并依据我公司多年来从事该行业的宝贵工程经验,经我公司技术服务组专业人员的认真分析研究,并对上述部位的防护1问题分析:锅炉卫燃带,炉膛出口处,焊缝处的磨损、减薄与气流中固体物料浓度、烟气速度、颗粒的特性硬度和流道几何形状等密切相关,而在CFB锅炉中,固体物料的浓度巨大,通常可达煤粉炉的几十倍到上百倍,并且烟气流速大,颗粒硬且棱角尖锐,因而在高速烟气的带动下,对CFB 锅炉水冷壁等受热面部位的冲刷磨损极为严重;尤其在护墙根部水冷壁部位,由于位处密相区边缘区,不但受到严重的高速高浓度含床料、燃料气流的强烈冲刷、磨损,而且存在严重的涡流效应、切割效应和离心作用。涡流效应在炉膛四角部位,由于该处形成边壁流,物料汇集此处较多,由于固体颗粒的惯性作用,局部磨损作用尤为明显,而切割效应体现在护墙根部水冷壁处,其原因是由于防护墙的顶部提供了一个平台,当焦渣以较高的速度下降到该平台时产生反弹,其中往水冷壁管侧反弹部分,对水冷壁管就产生了严重的切割效应,离心作用是由于颗粒运行时受到烟气离心作用而引起。其次还易受到高温氧化和硫酸盐及硫、硫化物的热腐蚀。水冷壁管具备了高温氧化和高温腐蚀条件,其烟气温度高,且是富氧燃烧,实践证明, 在300℃以上,管外表温度每升高50℃, 腐蚀速度增加1倍。锅炉在运行过程中受热面管表面首先发生高温氧化,表面生成Fe20s, 其次燃料灰中的Na20和K20与烟气中的SOs化合生成硫酸盐,其捕捉飞灰形成结渣和流渣,此时烟气中SOs与M2S04同管壁上的Fe20s反应生成复合硫酸盐MFe (S04) 2或MaFe (S04)3,此复合硫酸盐受高温又分解为疏松状氧化铁和硫酸盐沉积层,易被飞灰气流冲蚀带走,氧化腐蚀继续向管壁纵深进行;另外燃料中硫份,经燃烧生成的S和HeS也对管壁会产生强烈的腐蚀,与Fe反应生成FeS。\", \"figure\": [], \"height\": 1128, \"orgHeight\": 1128, \"orgWidth\": 912, \"prism_pagesInfo\": [{\"pageId\": 0, \"word\": \"1.1技术方案设计贵公司进行防磨喷涂的锅炉均为循环流化床锅炉,作为一种新型燃烧技术,由于炉型结构和设计参数等特点,在环保性能、燃烧效率、燃料适应性、高效脱硫及灰渣综合利用等方法,具有很大的优越性。然而, CFB锅炉受热面的磨损问题十分严重,贵公司决定采用超音速电弧金属喷涂技术来解决锅炉受热面磨损问题,以减少锅炉的非计划停运。我公司技术服务组根据全国各电厂的防磨防护情况,针对锅炉运行的详细状况、工艺参数以及失效因素,并依据我公司多年来从事该行业的宝贵工程经验,经我公司技术服务组专业人员的认真分析研究,并对上述部位的防护1问题分析:锅炉卫燃带,炉膛出口处,焊缝处的磨损、减薄与气流中固体物料浓度、烟气速度、颗粒的特性硬度和流道几何形状等密切相关,而在CFB锅炉中,固体物料的浓度巨大,通常可达煤粉炉的几十倍到上百倍,并且烟气流速大,颗粒硬且棱角尖锐,因而在高速烟气的带动下,对CFB 锅炉水冷壁等受热面部位的冲刷磨损极为严重;尤其在护墙根部水冷壁部位,由于位处密相区边缘区,不但受到严重的高速高浓度含床料、燃料气流的强烈冲刷、磨损,而且存在严重的涡流效应、切割效应和离心作用。涡流效应在炉膛四角部位,由于该处形成边壁流,物料汇集此处较多,由于固体颗粒的惯性作用,局部磨损作用尤为明显,而切割效应体现在护墙根部水冷壁处,其原因是由于防护墙的顶部提供了一个平台,当焦渣以较高的速度下降到该平台时产生反弹,其中往水冷壁管侧反弹部分,对水冷壁管就产生了严重的切割效应,离心作用是由于颗粒运行时受到烟气离心作用而引起。其次还易受到高温氧化和硫酸盐及硫、硫化物的热腐蚀。水冷壁管具备了高温氧化和高温腐蚀条件,其烟气温度高,且是富氧燃烧,实践证明, 在300℃以上,管外表温度每升高50℃, 腐蚀速度增加1倍。锅炉在运行过程中受热面管表面首先发生高温氧化,表面生成Fe20s, 其次燃料灰中的Na20和K20与烟气中的SOs化合生成硫酸盐,其捕捉飞灰形成结渣和流渣,此时烟气中SOs与M2S04同管壁上的Fe20s反应生成复合硫酸盐MFe (S04) 2或MaFe (S04)3,此复合硫酸盐受高温又分解为疏松状氧化铁和硫酸盐沉积层,易被飞灰气流冲蚀带走,氧化腐蚀继续向管壁纵深进行;另外燃料中硫份,经燃烧生成的S和HeS也对管壁会产生强烈的腐蚀,与Fe反应生成FeS。\"}], \"prism_paragraphsInfo\": [{\"paragraphId\": 0, \"word\": \"1.1技术方案设计\"}, {\"paragraphId\": 1, \"word\": \"贵公司进行防磨喷涂的锅炉均为循环流化床锅炉,作为一种新型燃烧技术,由于炉型结构和设计参数等特点,在环保性能、燃烧效率、燃料适应性、高效脱硫及灰渣综合利用等方法,具有很大的优越性。然而, CFB锅炉受热面的磨损问题十分严重,贵公司决定采用超音速电弧金属喷涂技术来解决锅炉受热面磨损问题,以减少锅炉的非计划停运。我公司技术服务组根据全国各电厂的防磨防护情况,针对锅炉运行的详细状况、工艺参数以及失效因素,并依据我公司多年来从事该行业的宝贵工程经验,经我公司技术服务组专业人员的认真分析研究,并对上述部位的防护\"}, {\"paragraphId\": 2, \"word\": \"1问题分析:\"}, {\"paragraphId\": 3, \"word\": \"锅炉卫燃带,炉膛出口处,焊缝处的磨损、减薄与气流中固体物料浓度、烟气速度、颗粒的特性硬度和流道几何形状等密切相关,而在CFB锅炉中,固体物料的浓度巨大,通常可达煤粉炉的几十倍到上百倍,并且烟气流速大,颗粒硬且棱角尖锐,因而在高速烟气的带动下,对CFB 锅炉水冷壁等受热面部位的冲刷磨损极为严重;尤其在护墙根部水冷壁部位,由于位处密相区边缘区,不但受到严重的高速高浓度含床料、燃料气流的强烈冲刷、磨损,而且存在严重的涡流效应、切割效应和离心作用。涡流效应在炉膛四角部位,由于该处形成边壁流,物料汇集此处较多,由于固体颗粒的惯性作用,局部磨损作用尤为明显,而切割效应体现在护墙根部水冷壁处,其原因是由于防护墙的顶部提供了一个平台,当焦渣以较高的速度下降到该平台时产生反弹,其中往水冷壁管侧反弹部分,对水冷壁管就产生了严重的切割效应,离心作用是由于颗粒运行时受到烟气离心作用而引起。\"}, {\"paragraphId\": 4, \"word\": \"其次还易受到高温氧化和硫酸盐及硫、硫化物的热腐蚀。水冷壁管具备了高温氧化和高温腐蚀条件, 其烟气温度高,且是富氧燃烧,实践证明, 在300℃以上,管外表温度每升高50℃, 腐蚀速度增加1倍。锅炉在运行过程中受热面管表面首先发生高温氧化,表面生成Fe20s, 其次燃料灰中的Na20和K20与烟气中的SOs化合生成硫酸盐,其捕捉飞灰形成结渣和流渣,此时烟气中SOs与M2S04同管壁上的Fe20s反应生成复合硫酸盐MFe (S04) 2或MaFe (S04)3,此复合硫酸盐受高温又分解为疏松状氧化铁和硫酸盐沉积层,易被飞灰气流冲蚀带走,氧化腐蚀继续向管壁纵深进行;另外燃料中硫份,经燃烧生成的S和HeS也对管壁会产生强烈的腐蚀,与Fe反应生成FeS。\"}], \"prism_rowsInfo\": [{\"rowId\": 0, \"word\": \"1.1技术方案设计\"}, {\"rowId\": 1, \"word\": \"贵公司进行防磨喷涂的锅炉均为循环流化床锅炉,作为一种新型燃烧技术,由于炉型结构和设计参\"}, {\"rowId\": 2, \"word\": \"数等特点,在环保性能、燃烧效率、燃料适应性、高效脱硫及灰渣综合利用等方法,具有很大\"}, {\"rowId\": 3, \"word\": \"的优越性。然而, CFB锅炉受热面的磨损问题十分严重,贵公司决定采用超音速电弧金属喷涂技\"}, {\"rowId\": 4, \"word\": \"术来解决锅炉受热面磨损问题,以减少锅炉的非计划停运。我公司技术服务组根据全国各电厂的\"}, {\"rowId\": 5, \"word\": \"防磨防护情况,针对锅炉运行的详细状况、工艺参数以及失效因素,并依据我公司多年来从事\"}, {\"rowId\": 6, \"word\": \"该行业的宝贵工程经验,经我公司技术服务组专业人员的认真分析研究,并对上述部位的防护\"}, {\"rowId\": 7, \"word\": \"1问题分析:\"}, {\"rowId\": 8, \"word\": \"锅炉卫燃带,炉膛出口处,焊缝处的磨损、减薄与气流中固体物料浓度、烟气速度、颗粒的特\"}, {\"rowId\": 9, \"word\": \"性硬度和流道几何形状等密切相关,而在CFB锅炉中,固体物料的浓度巨大,通常可达煤粉炉的\"}, {\"rowId\": 10, \"word\": \"几十倍到上百倍,并且烟气流速大,颗粒硬且棱角尖锐,因而在高速烟气的带动下,对CFB 锅\"}, {\"rowId\": 11, \"word\": \"炉水冷壁等受热面部位的冲刷磨损极为严重;尤其在护墙根部水冷壁部位,由于位处密相区边\"}, {\"rowId\": 12, \"word\": \"缘区,不但受到严重的高速高浓度含床料、燃料气流的强烈冲刷、磨损,而且存在严重的涡流\"}, {\"rowId\": 13, \"word\": \"效应、切割效应和离心作用。涡流效应在炉膛四角部位,由于该处形成边壁流,物料汇集此处\"}, {\"rowId\": 14, \"word\": \"较多,由于固体颗粒的惯性作用,局部磨损作用尤为明显,而切割效应体现在护墙根部水冷壁\"}, {\"rowId\": 15, \"word\": \"处,其原因是由于防护墙的顶部提供了一个平台,当焦渣以较高的速度下降到该平台时产生反\"}, {\"rowId\": 16, \"word\": \"弹,其中往水冷壁管侧反弹部分,对水冷壁管就产生了严重的切割效应,离心作用是由于颗粒\"}, {\"rowId\": 17, \"word\": \"运行时受到烟气离心作用而引起。\"}, {\"rowId\": 18, \"word\": \"其次还易受到高温氧化和硫酸盐及硫、硫化物的热腐蚀。水冷壁管具备了高温氧化和高温腐\"}, {\"rowId\": 19, \"word\": \"蚀条件,其烟气温度高,且是富氧燃烧,实践证明, 在300℃以上,管外表温度每升高50℃, 腐\"}, {\"rowId\": 20, \"word\": \"蚀速度增加1倍。锅炉在运行过程中受热面管表面首先发生高温氧化,表面生成Fe20s, 其次燃\"}, {\"rowId\": 21, \"word\": \"料灰中的Na20和K20与烟气中的SOs化合生成硫酸盐,其捕捉飞灰形成结渣和流渣,此时烟气中\"}, {\"rowId\": 22, \"word\": \"SOs与M2S04同管壁上的Fe20s反应生成复合硫酸盐MFe (S04) 2或MaFe (S04)3,此复合硫酸盐受\"}, {\"rowId\": 23, \"word\": \"高温又分解为疏松状氧化铁和硫酸盐沉积层,易被飞灰气流冲蚀带走,氧化腐蚀继续向管壁纵\"}, {\"rowId\": 24, \"word\": \"深进行;另外燃料中硫份,经燃烧生成的S和HeS也对管壁会产生强烈的腐蚀,与Fe反应生成\"}, {\"rowId\": 25, \"word\": \"FeS。\"}], \"prism_version\": \"1.0.9\", \"prism_wnum\": 26, \"prism_wordsInfo\": [{\"pageId\": 0, \"paragraphId\": 0, \"pos\": [{\"x\": 384, \"y\": 116}, {\"x\": 538, \"y\": 116}, {\"x\": 538, \"y\": 137}, {\"x\": 384, \"y\": 137}], \"prob\": 100, \"rowId\": 0, \"tableCellId\": -1, \"tableId\": -1, \"word\": \"1.1技术方案设计\"}, {\"pageId\": 0, \"paragraphId\": 1, \"pos\": [{\"x\": 129, \"y\": 149}, {\"x\": 776, \"y\": 149}, {\"x\": 776, \"y\": 169}, {\"x\": 129, \"y\": 168}], \"prob\": 100, \"rowId\": 1, \"tableCellId\": -1, \"tableId\": -1, \"word\": \"贵公司进行防磨喷涂的锅炉均为循环流化床锅炉,作为一种新型燃烧技术,由于炉型结构和设计参\"}, {\"pageId\": 0, \"paragraphId\": 1, \"pos\": [{\"x\": 120, \"y\": 177}, {\"x\": 779, \"y\": 177}, {\"x\": 779, \"y\": 198}, {\"x\": 120, \"y\": 197}], \"prob\": 100, \"rowId\": 2, \"tableCellId\": -1, \"tableId\": -1, \"word\": \"数等特点,在环保性能、燃烧效率、燃料适应性、高效脱硫及灰渣综合利用等方法,具有很大\"}, {\"pageId\": 0, \"paragraphId\": 1, \"pos\": [{\"x\": 121, \"y\": 205}, {\"x\": 787, \"y\": 207}, {\"x\": 787, \"y\": 227}, {\"x\": 121, \"y\": 225}], \"prob\": 100, \"rowId\": 3, \"tableCellId\": -1, \"tableId\": -1, \"word\": \"的优越性。然而, CFB锅炉受热面的磨损问题十分严重,贵公司决定采用超音速电弧金属喷涂技\"}, {\"pageId\": 0, \"para",
"Code": "noPermission",
"Message": "You are not authorized to perform this operation."
}
错误码
访问错误中心查看更多错误码。
变更历史
变更时间 | 变更内容概要 | 操作 |
---|---|---|
2022-08-17 | 新增 OpenAPI | 查看变更详情 |