API文档_文档智能(Document Mind)-阿里云帮助中心

本产品（文档自学习产品/2022-12-29）的OpenAPI采用V2版本RPC风格请求体&签名机制签名风格，签名细节参见V2版本RPC风格请求体&签名机制。我们已经为开发者封装了常见编程语言的SDK，开发者可通过下载SDK直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能满足使用需求，可通过签名机制进行自签名对接。由于自签名细节非常复杂，需花费5个工作日左右。因此建议加入我们的服务钉钉群（11370001915），在专家指导下进行签名对接。在使用API前，您需要准备好身份账号及访问密钥（AccessKey），才能有效通过客户端工具（SDK、CLI等）访问API。细节请参见创建AccessKey。

文档理解

API	API概述

API	API概述
文档解析（大模型版）	进行通用文档结构解析，从文档中提取出版面和文字等内容信息。
电子文档解析	进行电子文档结构解析，从文档本身的半结构化内容中解析出所包含的信息。
文档智能解析	进行通用文档抽取和理解，从文档中提取出层级结构、文本内容、KV字段、样式信息等。
表格智能解析	进行表格抽取和理解，从表格中提取出表格样式、表格内容、文本KV、表格KV等信息。
文档抽取	对各种类型文档和表格中的关键信息进行自动化抽取，返回通用KV结构化内容。

文档格式转换

API	API概述

API	API概述
PDF转Word	将PDF转换为可编辑的Word文档，精准识别文本内容，并保留原始文档的版面样式信息。
图片转Word	将图片转换为可编辑的Word文档，最多同时支持30张图片转换，精准识别文本内容，并保留原始文档的版面样式信息。
PDF转Excel	将PDF转换为可编辑的Excel文档，精准识别文本内容，并保留原始文档的版面样式信息。
图片转Excel	将图片转换为可编辑的Excel文档，最多同时支持30张图片转换，精准识别文本内容，并保留原始文档的版面样式信息。
PDF转图片	将PDF逐页转换为图片，最大可处理100页以内的PDF文档。
图片转PDF	将多张图片转换为PDF，最大可处理30张以内的图片。