文字识别介绍

文字识别技术基于阿里云深度学习技术,为您提供通用的印刷文字识别和文档结构化等能力。文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

服务开通

请单击立即开通在对应产品页面开通该服务,具体开通方式请参见新手指南

能力介绍

目前阿里云视觉智能开放平台提供如下文字识别能力。

类别

能力

说明

个人类卡证识别

身份证识别

识别二代身份证关键字段内容,关键字段包括:姓名、性别、民族、身份证号、出生日期、地址信息、有效起始时间、签发机关,同时可输出身份证区域位置和人脸位置信息。

银行卡识别

输入主流银行卡图像,输出3个信息,包括:发卡行、银行卡号、有效日期。

二维码识别

识别图像中是否含有二维码信息,输出图像中二维码包含的文本信息(每个二维码对应的URL或文本),可支持图像中含有多个二维码识别。

资产类证件识别

营业执照识别

识别营业执照关键字段内容,包括:公司地址、营业范围、注册资本、注册日期、公司法人、公司名称、注册号、公司类型、公司营业期限日期,同时可输出营业执照上二维码、印章位置。

通用文字类识别

通用文字识别

识别图像中文字内容和文字区域坐标,适用于多场景图像文字识别。

表格识别

自动识别表格位置、表格内容信息。适用于黑色的,横线、竖线都齐全的表格中内容识别。

PDF识别

可以对PDF上的文字进行结构化识别。

视频文字识别

可以实现对输入视频的结构化处理,返回对应的文字内容、文字区域坐标及时间等信息。

车辆交通类识别

驾驶证识别

识别驾驶证首页和副页关键字段内容,包括:档案编号、姓名、有效期时长、性别、发证日期、驾驶证号、驾驶证准驾车型、有效期开始时间、地址,共9个关键字段信息。

行驶证识别

识别行驶证首页和副页关键字段内容,输出品牌型号、车辆类型、车牌号码、检验记录、核定载质量、核定载人数等21个关键字段信息。

车牌识别

准确识别出图像中车牌位置,输出车牌位置坐标、车牌类型、车牌号码、车牌号码置信度、车牌置信度,共5个关键字段信息。

VIN码识别

识别车辆VIN码,输出车辆VIN码数值。

行业票证类识别

出租车发票识别

准确识别出全国各大城市出租车发票在图像中的位置,支持出租车发票结构化识别,输出发票号码、代码、车号、日期、时间、金额,共6个关键字段信息。

火车票识别

支持火车票结构化识别,输出乘车时间、始发站、目的站、座位席别、乘车人姓名、车次号、票价、车厢及座次号,共8个关键字段信息。

增值税发票识别

可以识别增值税发票(电子发票和纸质发票)关键字段内容,包括:校验码、复核人、开票人、发票代码、收款人等。

定额发票识别

可以对定额发票上的发票号码、发票代码、发票金额进行结构化识别。

增值税发票卷票识别

支持对卷票上包括价税合计、发票代码、发票号码、合计税额、合计金额、密码区、开票日期、税率、购买方识别号、销售方识别号等结构化识别。

应用场景

文字识别应用场景如下:

  • 注册登记审核

    通过身份证、护照识别、银行卡识别等能力,在互联网金融、公共网上办事大厅等场景,能够快速准确识别录入用户身份、账户信息,准确率高达99%,从而降低用户输入成本,提高人工审核效率,有效控制业务风险。

  • 报销凭证录入

    应用于企业税务核算、金融保费核发及内部报销等场景,实现对各类税务发票、医疗发票、交通票据等的自动识别和快速录入,能够有效减少人力成本,实现报销的自动化。

更多产品动态,请您持续关注阿里云视觉智能开放平台