文档解析抽取与格式转换API总览-文档智能-阿里云

本产品（文档自学习产品/2022-12-29）的OpenAPI采用V2版本RPC风格请求体&签名机制签名风格，签名细节参见V2版本RPC风格请求体&签名机制。我们提供了常见编程语言的SDK，您可以直接下载SDK并调用API而无需关心技术细节。如果现有SDK无法满足需求，可通过自签名方式对接，但自签名较复杂，预计需5个工作日。建议您加入服务钉钉群（1137 000 1915），在专家指导下完成对接。使用API前，请准备好身份账号及访问密钥（AccessKey），以便通过客户端工具（SDK、CLI等）访问API，细节请参见创建AccessKey。

说明

要通过代码调用本产品的 API 接口时还得确保 AccessKey 账号已添加访问文档智能的权限，可在 RAM 账户里边点击新增授权，搜索AliyunDocmindFullAccess 权限并添加。这样 RAM 账户下所属的 AccessKey 账号都具备了访问到文档智能的权限，操作详情可参照服务鉴权指南。

其他阿里云主账号若没有添加此权限，那其所属的 AccessKey 账号则无权访问文档智能产品。

文档理解

本API支持多种文档解析和信息抽取功能，您可以实现以下操作

API	API概述
文档解析（大模型版）	从文档中提取出版面和文字等内容信息。
电子文档解析	从文档本身的半结构化内容中解析出所包含的信息。
文档智能解析	提取出文档中的层级结构、文本内容、KV字段、样式信息等。
表格智能解析	提取表格中的样式、表格内容、文本KV、表格KV等信息。
文档抽取	自动化抽取文档和表格中的关键信息，返回通用KV结构化内容。

文档格式转换

API	API概述
PDF转Word	将PDF转换为可编辑的Word 文档。精准识别文本内容，并保留原始文档的版面样式信息。
PDF转图片	支持将 PDF 逐页转换为图片，最大可处理 100 页以内的PDF文档。
PDF转Excel	将PDF转换为可编辑的Excel文档。精准识别文本内容，并保留原始文档的版面样式信息。
图片转Excel	将图片转换为可编辑的Excel文档，最多同时支持30张图片转换。精准识别文本内容，并保留原始文档的版面样式信息。
图片转Word	将图片转换为可编辑的Word文档，最多同时支持30张图片转换。精准识别文本内容，并保留原始文档的版面样式信息。
图片转PDF	支持将多张图片合并为一个 PDF 文件，最大处理 30 张图片。