SubmitDocExtractionTask - 异步提交RAG、长文本理解信息抽取任务

用于从文档中提取关键信息,它根据用户预设的Key-Value模板或提示词模板进行信息抽取。 调用成功后返回taskId,后续调用GetDocExtractionResult获取信息抽取结果。 支持本地文件和URL文件两种方式: URL上传的异步提交服务接口为:SubmitDocExtractionTask接口。 本地文件上传的异步提交服务接口为:SubmitDocExtractionTaskAdvance接口。

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

授权信息

当前API暂无授权信息透出。

请求语法

POST /api/v2/aidoc/document/submitDocExtractionTask HTTP/1.1

请求参数

名称类型必填描述示例值
fileUrlstring

fileUrl/fileUrlObject 二选一:

  • fileUrl:以文档 URL 方式使用,单个文档(支持 1000 页以内、100MB 以内的文档)

  • fileUrlObject:以本地文件上传方式调用接口时使用,单个文档(支持 1000 页以内、100 MB 以内的文档)

说明 文件解析方式与支持上传的文档类型的关系
  • 长文本 RAG:支持 pdf、doc/docx,支持 1000 页
  • 图片处理:支持 pdf、jpg、jpeg、png、bmp
  • 长文本理解:支持 pdf、doc/docx、xls/xlsx
  • fileUrl:https://example.com/example.pdf fileUrlObject:本地文件生成的FileInputStream
    fileNamestring

    文件名需带文件类型后缀

    example.pdf
    templateIdstring

    唯一的解析模板 ID,用于指定文档要抽取的 key-value,需登录模板管理页面配置模板后获取对应的模板 ID。

    572d24k0c95a
    folderIdstring
    • 唯一的知识库文件夹 ID,当需要对文档进行分类管理、控制在线问答查询的文档范围时使用。
    • 文件夹 ID 需要登录文档智能控制台获取。
    xxxxx
    extractTypestring

    文档解析类型: 支持 rag、长文本理解类型,默认 rag

    rag

    返回参数

    名称类型描述示例值
    object

    Schema of Response

    requestIdstring

    请求 ID。

    83A5A7DD-8974-5769-952E-590A97BEA34E
    dataobject

    返回数据

    taskIdstring

    任务 ID。

    864773ec-d35b-4c36-8871-52d07fbe806d

    示例

    正常返回示例

    JSON格式

    {
      "requestId": "83A5A7DD-8974-5769-952E-590A97BEA34E",
      "data": {
        "taskId": "864773ec-d35b-4c36-8871-52d07fbe806d"
      }
    }

    错误码

    访问错误中心查看更多错误码。