文档

文档理解

更新时间:

功能简介

文档理解对各类文档和表格进行结构化识别与理解,返回层级树和版面分析等相关内容。

功能详情

文档智能解析

进行通用文档解析,从文档中提取出逻辑层级结构、文本内容、表格内容、Key-Value键值字段、样式信息等。基于对文档的内容信息、版面信息和逻辑信息的分析理解,以结构化数据的形态输出抽取结果。

表格智能解析

进行通用表格解析,从表格中提取出表格样式、表格内容、文本KV、表格KV等。基于对表格的内容信息、版面信息和逻辑信息的分析理解,以结构化数据的形态输出抽取结果。

文档抽取

进行文档关键信息抽取,对各种类型的文档和表格中的关键信息进行智能化抽取,返回Key-Value内容。既包括文本段落中的KV字段,也包括表格中的KV字段。

功能优势

算法技术先进

依托阿里丰富的文档场景打磨的多模态文档识别与理解引擎,算法效果与性能指标处于先进水平。

行业应用丰富

覆盖海关物流、司法、招投标、政务、金融财税等多行业多场景应用,可满足各行各业的文档处理需求。

部署方式灵活

支持公共云API、混合云Docker、aPaaS、SaaS等多种产品接入方式,产品形态灵活,使用门槛低。

服务质量可靠

提供高可用的文档处理能力,已在海量文档处理业务中反复锤炼,服务稳定性高,支持弹性扩缩容。

应用场景

大模型训练

支持对PDF、Word、Markdown等多种文档格式的处理,返回文档的层级结构,并结合文档语义信息,处理成文档切片后用于大模型训练,方便下游结合大模型开发智能问答等应用。

检索增强生成RAG

可以精准识别并解析包括企业日常办公中常见的Office文档(Word/Excel/PPT )、PDF、Html、图片等在内的主流文件类型,返回文档的样式、版面信息和层级树结构,从而为RAG输入高精准度、高连贯语义的切块(Chunk),保障了整个RAG方案的基础效果。

搜索增强生成RAG最终稿.png

办公文档处理

对各类办公文档和表单进行智能化处理,实现文档的结构化信息提取,提升办公场景下的生产力。