产品简介-产品概述

本章节介绍阿里云文字识别的产品概述。

阿里云OCR是依据阿里巴巴多年AI技术积累打造的全栈全场景OCR文本识别类产品。多年来, 通过持续整合前沿AI技术和行业实战经验,阿里云OCR打磨出了能够承载跨行业敏捷应用的技术架构,具备图像文字定位、文字识别和文字理解的全栈技术体系,形成了包含通用文本识别、卡证票据自动化分类及结构化识别、卡证票据混贴识别、表格文档批量结构化识别以及试题作业智能识别等全量OCR原子能力矩阵。支持公有云调用、私有化部署、终端 SDK 等云边端全业务场景服务能力。

产品概览

读光解决方案大图

*名词解释:读光是阿里云OCR的产品品牌,由阿里巴巴达摩院提供算法服务。本文档中阿里云OCR与读光OCR为相同概念,特此说明。

产品分类

文字识别(OCR)可以将图片中的文字信息转换为可编辑文本,阿里云根据客户的业务场景和需求,将产品分为了OCR统一识别、通用文字识别、个人证照识别、发票凭证识别、教育场景识别、车辆物流识别、企业资质识别、小语种文字识别等几大类商品,满足各种客户的图片识别需求。

  • OCR统一识别

    • 适用于用一个API覆盖多场景下各类文档图片或文档扫描件的文字信息识别或文字信息抽取。

  • 通用文字识别

    • 适用于各类常见文档图片或扫描件中的文字信息按照文档原有的格式进行文本识别和还原。

  • 个人证照识别

    • 个人证照类识别提供个人身份识别所需的身份证、银行卡、护照等证件的结构化识别服务。

  • 票据凭证识别

    • 票据凭证系列提供企业报销所需的各类发票的结构化识别以及混贴发票的自动分割与识别。

  • 教育场景识别

    • OCR识别能力赋能教育应用场景中试题题目、数学公式、速算题目等信息智能化识别需求。

  • 车辆物流识别

    • 适用于交通物流相关的行驶证、驾驶证、车牌、vin码、电子运单等汽车相关内容识别。

  • 企业资质识别

    • 提供企事业单位在业务开展过程中使用到的营业执照、商标注册证等资质证明的结构化识别服务。

  • 小语种识别

    • 小语种文字识别能够支持国际主流几大语系的自动语言分类判定并返回对应语言的文字信息。

  • 医疗场景识别

    • 医疗场景识别提供抗疫场景下核酸检测报告识别能力。

  • 票证核验

    • 提供针对发票及企业执照等各类票证单据的真伪核验能力。

  • 文档格式转换

    • 可实现图片、PDF、扫描件与Word、Excel等多种格式的转换,保留版式样式信息。

  • 文档智能解析

    • 从文档中提取出逻辑层级结构、文本内容、表格内容、 Key-value键值字段、样式信息等。