API概览

本产品(文档自学习产品/2022-12-29)的OpenAPI采用V2版本RPC风格请求体&签名机制签名风格,签名细节参见V2版本RPC风格请求体&签名机制。我们已经为开发者封装了常见编程语言的SDK,开发者可通过下载SDK直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能满足使用需求,可通过签名机制进行自签名对接。由于自签名细节非常复杂,需花费5个工作日左右。因此建议加入我们的服务钉钉群(11370001915),在专家指导下进行签名对接。

在使用API前,您需要准备好身份账号及访问密钥(AccessKey),才能有效通过客户端工具(SDK、CLI等)访问API。细节请参见创建AccessKey

文档理解

API

API概述

文档解析(大模型版)

进行通用文档结构解析,从文档中提取出版面和文字等内容信息。

电子文档解析

进行电子文档结构解析,从文档本身的半结构化内容中解析出所包含的信息。

文档智能解析

进行通用文档抽取和理解,从文档中提取出层级结构、文本内容、KV字段、样式信息等。

表格智能解析

进行表格抽取和理解,从表格中提取出表格样式、表格内容、文本KV、表格KV等信息。

文档抽取

对各种类型文档和表格中的关键信息进行自动化抽取,返回通用KV结构化内容。

文档格式转换

API

API概述

PDF转Word

将PDF转换为可编辑的Word文档,精准识别文本内容,并保留原始文档的版面样式信息。

图片转Word

将图片转换为可编辑的Word文档,最多同时支持30张图片转换,精准识别文本内容,并保留原始文档的版面样式信息。

PDF转Excel

将PDF转换为可编辑的Excel文档,精准识别文本内容,并保留原始文档的版面样式信息。

图片转Excel

将图片转换为可编辑的Excel文档,最多同时支持30张图片转换,精准识别文本内容,并保留原始文档的版面样式信息。

PDF转图片

将PDF逐页转换为图片,最大可处理100页以内的PDF文档。

图片转PDF

将多张图片转换为PDF,最大可处理30张以内的图片。