SubmitDocExtractionTask - 异步提交RAG、长文本理解信息抽取任务

用于从文档中提取关键信息,它根据用户预设的Key-Value模板或提示词模板进行信息抽取。 调用成功后返回taskId,后续调用GetDocExtractionResult获取信息抽取结果。 支持本地文件和URL文件两种方式: URL上传的异步提交服务接口为:SubmitDocExtractionTask接口。 本地文件上传的异步提交服务接口为:SubmitDocExtractionTaskAdvance接口。

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

调试

授权信息

当前API暂无授权信息透出。

请求语法

POST /api/v2/aidoc/document/submitDocExtractionTask HTTP/1.1

请求参数

名称

类型

必填

描述

示例值

fileUrl

string

fileUrl/fileUrlObject 二选一:

  • fileUrl:以文档 URL 方式使用,单个文档(支持 3000 页以内、500MB 以内的文档)

  • fileUrlObject:以本地文件上传方式调用接口时使用,单个文档(支持 3000 页以内、500MB 以内的文档)

说明

文档抽取方式与支持上传的文档类型的关系

  • 长文本 RAG:支持 pdf, doc/docx, xlsx, csv, txt,支持 3000 页

  • 图片处理:支持 pdf, jpg, jpeg, png, bmp, jpe, tif, tiff, webp, heic

  • 长文本理解:支持 doc/docx, xlsx, pdf, csv, txt

fileUrl:https://example.com/example.pdf fileUrlObject:本地文件生成的FileInputStream

fileName

string

文件名需带文件类型后缀

example.pdf

templateId

string

唯一的抽取模板 ID,用于指定文档要抽取的内容,需登录模板管理页面配置模板后获取对应的模板 ID。

572d24k0c95a

folderId

string

  • 唯一的知识库文件夹 ID,当需要对文档进行分类管理、控制在线问答查询的文档范围时使用。

  • 文件夹 ID 需要登录文档智能控制台获取。

xxxxx

extractType

string

文档抽取类型: 支持 rag、长文本理解类型,默认 rag

rag

返回参数

名称

类型

描述

示例值

object

Schema of Response

requestId

string

请求 ID。

83A5A7DD-8974-5769-952E-590A97BEA34E

data

object

返回数据

taskId

string

任务 ID。

864773ec-d35b-4c36-8871-52d07fbe806d

示例

正常返回示例

JSON格式

{
  "requestId": "83A5A7DD-8974-5769-952E-590A97BEA34E",
  "data": {
    "taskId": "864773ec-d35b-4c36-8871-52d07fbe806d"
  }
}

错误码

访问错误中心查看更多错误码。

变更历史

更多信息,参考变更详情