本产品(文档自学习产品/2022-12-29
)的OpenAPI采用V2版本RPC风格请求体&签名机制签名风格,签名细节参见V2版本RPC风格请求体&签名机制。我们已经为开发者封装了常见编程语言的SDK,开发者可通过下载SDK直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能满足使用需求,可通过签名机制进行自签名对接。由于自签名细节非常复杂,需花费5个工作日左右。因此建议加入我们的服务钉钉群(11370001915),在专家指导下进行签名对接。
在使用API前,您需要准备好身份账号及访问密钥(AccessKey),才能有效通过客户端工具(SDK、CLI等)访问API。细节请参见创建AccessKey。
文档理解
API | API概述 |
进行通用文档结构解析,从文档中提取出版面和文字等内容信息。 | |
进行电子文档结构解析,从文档本身的半结构化内容中解析出所包含的信息。 | |
进行通用文档抽取和理解,从文档中提取出层级结构、文本内容、KV字段、样式信息等。 | |
进行表格抽取和理解,从表格中提取出表格样式、表格内容、文本KV、表格KV等信息。 | |
对各种类型文档和表格中的关键信息进行自动化抽取,返回通用KV结构化内容。 |
文档格式转换
API | API概述 |
将PDF转换为可编辑的Word文档,精准识别文本内容,并保留原始文档的版面样式信息。 | |
将图片转换为可编辑的Word文档,最多同时支持30张图片转换,精准识别文本内容,并保留原始文档的版面样式信息。 | |
将PDF转换为可编辑的Excel文档,精准识别文本内容,并保留原始文档的版面样式信息。 | |
将图片转换为可编辑的Excel文档,最多同时支持30张图片转换,精准识别文本内容,并保留原始文档的版面样式信息。 | |
将PDF逐页转换为图片,最大可处理100页以内的PDF文档。 | |
将多张图片转换为PDF,最大可处理30张以内的图片。 |