文档

什么是文档智能

更新时间:

本文介绍阿里云文档智能(Document Mind)的产品概述、业务价值、产品架构及核心能力,并将通义智文作为文档智能与大模型结合的新品进行发布。

通义智文新品发布

通义智文https://tongyi.aliyun.com/zhiwen,是一款基于通义大模型的AI阅读助手,支持网页阅读、论文阅读、图书阅读和自由阅读,让AI帮你读得多、读得快、读得懂。

通义智文具备场景化阅读、结构化导读、给我灵感、多格式文档和超长文档处理等亮点功能,以及文档智能大小模型协同的核心技术,实现高效阅读并沉淀专属知识资产。

image.png

通义智文主要功能

场景化阅读
  • 支持网页阅读、论文阅读、图书阅读和自由阅读,针对不同场景提供个性化的阅读功能。

结构化导读
  • 可对上传的文档生成全文概述、分章节速读等导读内容,帮助用户更好地阅读和理解。

文档对话
  • 基于文档内容进行提问并生成回答,可跳转至原始文档的对应段落进行内容溯源。

多格式文档添加
  • 既支持上传PDF、Word、图片、HTML等格式的本地文档,也支持输入网址添加网页。

知识笔记沉淀
  • 可将导读、对话内容插入到笔记中进行整理,并支持导出pdf、word、markdown等格式。

文档空间
  • 用户上传的文档默认都会作为文档空间的内容沉淀起来,并可与阅读记录隔离开,互不干扰。

image.png

说明:通义智文上述功能可直接在PC端https://tongyi.aliyun.com/zhiwen访问使用网页版产品,现阶段暂不提供API方式接入。

文档智能产品概述

文档智能(Document Mind),基于阿里巴巴达摩院多年技术积累打造的多模态文档识别与理解引擎,为用户提供通用文档智能、行业文档智能和文档自学习能力,可满足各种场景下的智能文档处理需求。

为什么选择文档智能

企业数据大多数都以文本、图片、扫描件、电子表格、在线文档、邮件等文档的形式存在,难以流通和处理,大量有价值的信息都被锁定在非结构化的文档中,无法充分发挥出数据价值。

文档智能深度融合文字识别、自然语言处理、图像处理、电子文档解析、文档预训练模型等多项技术,对非结构化和半结构化文档进行智能自动化处理,从而简化业务操作流程、提升文档处理效率。

选择文档智能,您可以高效完成以下文档处理任务:

  • 结构化解析文档,提取文档中的层级树、版面、表格和字段等元素。

  • 进行文档格式转换,如PDF转Word/Excel、图片转Word/Excel等。

  • 在贸易单证、合同等企业文档中进行场景化智能文档处理。

  • 借助自学习工具,自行定义所需抽取的文档信息并训练文档处理模型。

产品架构

文档智能平台以非结构化文档为输入,依托文档智能预训练技术和产品,输出处理后的结构化数据。具体产品架构图如下所示。

image

产品能力

通用文档智能产品

文档理解

对各类文档和表格进行结构化识别与理解,并可在此基础上完成文档抽取等多种通用场景下的智能文档处理任务。

文档格式转换

将PDF、图片等不可编辑的文档转换为Word、Excel等可编辑的文档格式,在实现高精度内容识别的同时,最大限度地保留文档版式样式。

行业文档智能产品

贸易单证识别

针对报关、货代、金融风控等贸易业务涉及的单据流转场景,结合文字识别和自然语言处理技术,提供十余种单据的分类和识别,实现AI替代传统的单据信息手动录入。

文档自学习产品

文档自学习

提供数据标注和训练能力,支持各类文档和表格的自学习训练。

  • 本页导读 (0)