OCR的通用文字识别简介,功能优势,应用场景及API概览

本文介绍阿里云文字识别-通用文字识别系列相关产品的功能、特色优势及应用场景，并为您提供产品的API快捷入口。

产品介绍

读光OCR通用识别类产品，可对各类常见文档图片或文档扫描件中的文字信息按照文档原有的格式进行文本识别和还原。为了能够更好的还原文字信息和文档结构，读光文档识别在通用全文识别能力（文字定位、行分析、文字识别）的基础上，增加了文档结构的版面分析和文档图像处理能力，使得文档类图像也能按照结构化的方式进行文档元素提取，进一步提升文档识别的产品体验。

说明

功能体验地址：https://duguang.aliyun.com/experience?type=universal

开通享免费额度：https://ocr.console.aliyun.com/overview

购买地址：https://common-buy.aliyun.com/?commodityCode=ocr_general_dp_cn

产品功能

通用文字识别

读光OCR通用文字识别适用于各行业场景下的非结构化文字识别，支持返回文字内容和位置坐标信息。

通用文字识别

全文识别高精版（推荐）

读光OCR全文识别高精版支持多格式版面、复杂文档背景和光照环境的精准识别，文档识别率超过99.7%。同时，针对有印章、手印的文档，可实现印章擦除后识别，支持低置信度过滤、图案检测等高阶功能。

全文识别高精版1

通用手写体识别

读光OCR通用手写体识别模型可以支持中文手写体、英文手写体、数字手写体等各种复杂场景的手写文字识别，同时具备印刷文字识别能力，适用于识别各类手写笔记、板书等。

通用手写体

表格识别

读光OCR表格识别可支持对有线表格、条纹表格、无线表格进行有效识别。

说明

表格智能解析：进行通用表格解析，从表格中提取出表格样式、表格内容、文本KV、表格KV等。支持100M、100页之内的PDF文档，以及30张之内的图片文档格式。立即免费体验

表格识别

电商图片文字识别

读光OCR电商图片文字识别是专门针对电商商品宣传图片、社区贴吧图片、网络UGC图片等网络场景下图片字符快速精准识别的原子能力产品，在违规广告识别、信息审核管理和网络安全治理等场景下具有极大应用价值。电商文字识别

文档结构化识别

读光OCR文档结构化识别可对文档信息进行结构化识别，并提供元素平铺和层级树两种视角的版面信息输出。能够将文档中的文字元素（单字、文字块、行等）和相应的版面格式（标题、段落、表格）抽离并按顺序输出。目前仅支持单页文档。

说明

文档智能解析：从文档中提取出逻辑层级结构、文本内容、表格内容、 Key-value键值字段、样式信息等。基于对文档的内容信息、版面信息和逻辑信息的分析理解，以结构化数据的形态输出抽取结果。支持100M、100页之内的PDF文档，以及30张之内的图片文档格式。立即免费体验

特色优势

准确率高

利用海量的图片样本训练模型，具有业内领先的准确率。以身份证识别为例，准确率超过99%。

实时性高

依托于阿里自建的EAS在线服务集群，精益求精优化Inference技术，提供弹性伸缩的低延时服务。

技术前沿精深

基于阿里云人工智能平台 PAI，应用阿里深度优化的深度学习框架PAI-Tensorflow，训练出业界先进的文本检测模型及文本识别模型。

服务稳定

根据调用量提供弹性服务，扩展性好，算法持续的迭代优化对用户稳定性无影响。

应用场景

图片内容审核

各类通用型接口，可针对不同场景，识别内容进行内容审核。及时发现违规行为，大大降低人力成本，广泛应用于电商内容治理场景。

合同文档类识别

通用文字识别可用于识别合同、文档、小说等图片，用于合同校对、文档检索、PDF提取等场景，广泛应用于司法卷宗管理、企业法务合同审核、金融/保险自动化流程等行业。

API快捷入口

云市场API快捷入口（旧）	官网API快捷入口（新）
全文识别高精版	RecognizeAdvanced
通用手写体识别	RecognizeHandwriting
电商图片文字识别	RecognizeBasic
表格识别	RecognizeTableOcr
通用文字识别	RecognizeGeneral
文档结构化还原识别	RecognizeDocumentStructure