首页 文档智能 产品简介 什么是文档智能

什么是文档智能

本文介绍阿里云文档智能(Document Mind)的业务价值、产品架构及核心能力。

产品概述

文档智能(Document Mind),基于阿里巴巴达摩院多年技术积累打造的多模态文档识别与理解引擎,为用户提供通用文档智能、行业文档智能和文档自学习能力,可满足各种场景下的智能文档处理需求。

为什么选择文档智能

企业数据大多数都以文本、图片、扫描件、电子表格、在线文档、邮件等文档的形式存在,难以流通和处理,大量有价值的信息都被锁定在非结构化的文档中,无法充分发挥出数据价值。

文档智能深度融合文字识别、自然语言处理、图像处理、电子文档解析、文档预训练模型等多项技术,对非结构化和半结构化文档进行智能自动化处理,从而简化业务操作流程、提升文档处理效率。

选择文档智能,您可以高效完成以下文档处理任务:

  • 结构化解析文档,提取文档中的层级树、版面、表格和字段等元素。

  • 进行文档格式转换,如PDF转Word/Excel、图片转Word/Excel等。

  • 实时纠正字词、语法和标点差错,实现更为规范专业的文档写作。

  • 在招投标、法律文书、合同等企业文档中进行场景化智能文档处理。

  • 借助自学习工具,自行定义所需抽取的文档信息并训练文档处理模型。

产品架构

文档智能平台以非结构化文档为输入,依托文档智能预训练技术和产品,输出处理后的结构化数据。具体产品架构图如下所示。

image

产品能力

通用文档智能产品

文档理解

对各类文档和表格进行结构化识别与理解,并可在此基础上完成文档抽取和比对等多种通用场景下的智能文档处理任务。

文档格式转换

将PDF、图片等不可编辑的文档转换为Word、Excel等可编辑的文档格式,在实现高精度内容识别的同时,最大限度地保留文档版式样式。

文档纠错

对文档中的文字、词语、语法和标点等差错进行纠正,检查文档中各类中英文问题并返回修改建议,实现高效、准确、规范的文档写作。

行业文档智能产品

智能招投标

智能化完成招标公告解析,自动化抽取招中标主体、预算/中标金额、标的等20+字段的抽取,可落地智能拓客、招商等场景应用。

贸易单证识别

针对报关、货代、金融风控等贸易业务涉及的单据流转场景,结合文字识别和自然语言处理技术,提供十余种单据的分类和识别,实现AI替代传统的单据信息手动录入。

文档自学习产品

文档自学习

提供数据标注和训练能力,支持各类文档和表格的自学习训练。

阿里云首页 文档智能 相关技术圈