文字识别技术基于阿里云深度学习技术,为您提供通用的印刷文字识别和文档结构化等能力。文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。
服务开通
能力介绍
目前阿里云视觉智能开放平台提供如下文字识别能力。
类别 | 能力 | 说明 |
个人类卡证识别 | 识别二代身份证关键字段内容,关键字段包括:姓名、性别、民族、身份证号、出生日期、地址信息、有效起始时间、签发机关,同时可输出身份证区域位置和人脸位置信息。 | |
输入主流银行卡图像,输出3个信息,包括:发卡行、银行卡号、有效日期。 | ||
识别图像中是否含有二维码信息,输出图像中二维码包含的文本信息(每个二维码对应的URL或文本),可支持图像中含有多个二维码识别。 | ||
资产类证件识别 | 识别营业执照关键字段内容,包括:公司地址、营业范围、注册资本、注册日期、公司法人、公司名称、注册号、公司类型、公司营业期限日期,同时可输出营业执照上二维码、印章位置。 | |
通用文字类识别 | 识别图像中文字内容和文字区域坐标,适用于多场景图像文字识别。 | |
自动识别表格位置、表格内容信息。适用于黑色的,横线、竖线都齐全的表格中内容识别。 | ||
可以对PDF上的文字进行结构化识别。 | ||
可以实现对输入视频的结构化处理,返回对应的文字内容、文字区域坐标及时间等信息。 | ||
车辆交通类识别 | 识别驾驶证首页和副页关键字段内容,包括:档案编号、姓名、有效期时长、性别、发证日期、驾驶证号、驾驶证准驾车型、有效期开始时间、地址,共9个关键字段信息。 | |
识别行驶证首页和副页关键字段内容,输出品牌型号、车辆类型、车牌号码、检验记录、核定载质量、核定载人数等21个关键字段信息。 | ||
准确识别出图像中车牌位置,输出车牌位置坐标、车牌类型、车牌号码、车牌号码置信度、车牌置信度,共5个关键字段信息。 | ||
识别车辆VIN码,输出车辆VIN码数值。 | ||
行业票证类识别 | 准确识别出全国各大城市出租车发票在图像中的位置,支持出租车发票结构化识别,输出发票号码、代码、车号、日期、时间、金额,共6个关键字段信息。 | |
支持火车票结构化识别,输出乘车时间、始发站、目的站、座位席别、乘车人姓名、车次号、票价、车厢及座次号,共8个关键字段信息。 | ||
可以识别增值税发票(电子发票和纸质发票)关键字段内容,包括:校验码、复核人、开票人、发票代码、收款人等。 | ||
可以对定额发票上的发票号码、发票代码、发票金额进行结构化识别。 | ||
支持对卷票上包括价税合计、发票代码、发票号码、合计税额、合计金额、密码区、开票日期、税率、购买方识别号、销售方识别号等结构化识别。 |
应用场景
文字识别应用场景如下:
注册登记审核
通过身份证、护照识别、银行卡识别等能力,在互联网金融、公共网上办事大厅等场景,能够快速准确识别录入用户身份、账户信息,准确率高达99%,从而降低用户输入成本,提高人工审核效率,有效控制业务风险。
报销凭证录入
应用于企业税务核算、金融保费核发及内部报销等场景,实现对各类税务发票、医疗发票、交通票据等的自动识别和快速录入,能够有效减少人力成本,实现报销的自动化。
更多产品动态,请您持续关注阿里云视觉智能开放平台。