本产品(文档自学习产品/2022-12-29)的OpenAPI采用V2版本RPC风格请求体&签名机制签名风格,签名细节参见V2版本RPC风格请求体&签名机制。我们提供了常见编程语言的SDK,您可以直接下载SDK并调用API而无需关心技术细节。如果现有SDK无法满足需求,可通过自签名方式对接,但自签名较复杂,预计需5个工作日。建议您加入服务钉钉群(1137 000 1915),在专家指导下完成对接。使用API前,请准备好身份账号及访问密钥(AccessKey),以便通过客户端工具(SDK、CLI等)访问API,细节请参见创建AccessKey。
要通过代码调用本产品的 API 接口时还得确保 AccessKey 账号已添加访问文档智能的权限,可在 RAM 账户里边点击新增授权,搜索AliyunDocmindFullAccess 权限并添加。这样 RAM 账户下所属的 AccessKey 账号都具备了访问到文档智能的权限,操作详情可参照服务鉴权指南。
其他阿里云主账号若没有添加此权限,那其所属的 AccessKey 账号则无权访问文档智能产品。
文档理解
本API支持多种文档解析和信息抽取功能,您可以实现以下操作
API | API概述 |
API | API概述 |
从文档中提取出版面和文字等内容信息。 | |
从文档本身的半结构化内容中解析出所包含的信息。 | |
提取出文档中的层级结构、文本内容、KV字段、样式信息等。 | |
提取表格中的样式、表格内容、文本KV、表格KV等信息。 | |
自动化抽取文档和表格中的关键信息,返回通用KV结构化内容。 |
文档格式转换
API | API概述 |
API | API概述 |
将PDF转换为可编辑的Word 文档。精准识别文本内容,并保留原始文档的版面样式信息。 | |
支持将 PDF 逐页转换为图片,最大可处理 100 页以内的PDF文档。 | |
将PDF转换为可编辑的Excel文档。精准识别文本内容,并保留原始文档的版面样式信息。 | |
将图片转换为可编辑的Excel文档,最多同时支持30张图片转换。精准识别文本内容,并保留原始文档的版面样式信息。 | |
将图片转换为可编辑的Word文档,最多同时支持30张图片转换。精准识别文本内容,并保留原始文档的版面样式信息。 | |
支持将多张图片合并为一个 PDF 文件,最大处理 30 张图片。 |
- 本页导读 (1)
- 文档理解
- 文档格式转换