GetDocParsingResult - 获取文档解析结果

用于文档解析结果查询。 入参taskId来自接口SubmitDocParsingTaskAdvance、SubmitDocParsingTask返回结果中的taskId。 查询结果有处理中、处理成功、处理失败三种情况。

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

授权信息

下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:

  • 操作:是指具体的权限点。
  • 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
  • 资源类型:是指操作中支持授权的资源类型。具体说明如下:
    • 对于必选的资源类型,用前面加 * 表示。
    • 对于不支持资源级授权的操作,用全部资源表示。
  • 条件关键字:是指云产品自身定义的条件关键字。
  • 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
操作访问级别资源类型条件关键字关联操作
energy:GetDocParsingResultnone
*全部资源
*

请求语法

POST /api/v2/aidoc/document/getDocParsingResult HTTP/1.1

请求参数

名称类型必填描述示例值
bodyobject

请求参数。

taskIdstring
  • 任务 ID。
  • taskId 从 SubmitDocParsingTaskAdvance、SubmitDocParsingTask 接口获取。
2c22388d-e2ed-44fe-99e6-99922f15e7bb
returnFormatstring
  • 文件解析结果支持 markdown、json 两种方式。
  • 默认返回 markdown 格式。
md

返回参数

名称类型描述示例值
object

Schema of Response

requestIdstring

Id of the request

83A5A7DD-8974-5769-952E-590A97BEA34E
dataobject

返回结果。

contentstring
  • 文件解析返回的解析内容。
  • 根据请求参数 returnFormat 返回,markdown 格式或者 json 格式数据。具体格式参考: json 返回结构
{\"doc_info\":{\"languages\":[\"zh\",\"en\"],\"doc_type\":\"pdf\",\"pdf_toc\":[{\"title\":\"封面\",\"level\":0,\"page\":0}],\"pages\":366,\"page_list\":[{\"imageWidth\":596,\"imageHeight\":842,\"pageIdAllDocs\":0,\"fileIndex\":0,\"pageIdCurDoc\":0,\"angle\":0}],\"doc_data\":[{\"uniqueId\":\"about_us_para\",\"page_num\":\"01\",\"index\":\"xxx\",\"name\":\"xxx\",\"type\":\"xxxx\",\"subType\":\"xxx\",\"text\":\"xxx\",\"before_text\":\"xxx\",\"after_text\":\"xxx\",\"extInfo\":[{\"uniqueId\":\"b0x1x0\",\"pos\":[{\"x\":229,\"y\":208},{\"x\":421,\"y\":208},{\"x\":421,\"y\":242},{\"x\":229,\"y\":242}],\"text\":\"Kurt Götze\",\"type\":\"Text\",\"subType\":\"Text\",\"pageNum\":[0],\"index\":0}]}]}}

示例

正常返回示例

JSON格式

{
  "requestId": "83A5A7DD-8974-5769-952E-590A97BEA34E",
  "data": {
    "content": "{\\\"doc_info\\\":{\\\"languages\\\":[\\\"zh\\\",\\\"en\\\"],\\\"doc_type\\\":\\\"pdf\\\",\\\"pdf_toc\\\":[{\\\"title\\\":\\\"封面\\\",\\\"level\\\":0,\\\"page\\\":0}],\\\"pages\\\":366,\\\"page_list\\\":[{\\\"imageWidth\\\":596,\\\"imageHeight\\\":842,\\\"pageIdAllDocs\\\":0,\\\"fileIndex\\\":0,\\\"pageIdCurDoc\\\":0,\\\"angle\\\":0}],\\\"doc_data\\\":[{\\\"uniqueId\\\":\\\"about_us_para\\\",\\\"page_num\\\":\\\"01\\\",\\\"index\\\":\\\"xxx\\\",\\\"name\\\":\\\"xxx\\\",\\\"type\\\":\\\"xxxx\\\",\\\"subType\\\":\\\"xxx\\\",\\\"text\\\":\\\"xxx\\\",\\\"before_text\\\":\\\"xxx\\\",\\\"after_text\\\":\\\"xxx\\\",\\\"extInfo\\\":[{\\\"uniqueId\\\":\\\"b0x1x0\\\",\\\"pos\\\":[{\\\"x\\\":229,\\\"y\\\":208},{\\\"x\\\":421,\\\"y\\\":208},{\\\"x\\\":421,\\\"y\\\":242},{\\\"x\\\":229,\\\"y\\\":242}],\\\"text\\\":\\\"Kurt Götze\\\",\\\"type\\\":\\\"Text\\\",\\\"subType\\\":\\\"Text\\\",\\\"pageNum\\\":[0],\\\"index\\\":0}]}]}}"
  }
}

错误码

访问错误中心查看更多错误码。