文字识别技术是基于阿里云深度学习技术,为您提供通用的印刷文字识别和文档结构化等能力。文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

服务开通

请单击立即开通在对应产品页面开通该服务,具体开通方式请参见服务开通

能力介绍

目前阿里云视觉智能开放平台提供如下文字识别能力。
类别 能力 说明
个人类卡证识别 身份证识别 识别二代身份证关键字段内容,关键字段包括:姓名、性别、民族、身份证号、出生日期、地址信息、有效起始时间、签发机关,同时可输出身份证区域位置和人脸位置信息。
户口页识别 支持户口本常住人口登记卡结构化识别,输出姓名、籍贯、民族、性别、身份证号、出生地、出生日期、户主或户主关系、承办人签章、注册章位置、其他印章位置,共11个关键字段信息。
银行卡识别 输入主流银行卡图像,输出3个信息,包括:发卡行、银行卡号、有效日期。
名片识别 识别各类名片关键字段内容。包括:姓名、职位、公司、部门、座机号、手机号、地址、邮箱,共8个关键字段信息。
二维码识别 识别图像中是否含有二维码信息,输出图像中二维码包含的文本信息(每个二维码对应的url或文本),可支持图像中含有多个二维码识别。
中国护照识别 识别中国护照关键字段内容,关键字段包括:中文姓名(带拼音)、护照号码、护照人身份ID、性别、英文姓名、出生日期、出生地(带拼音)、国籍、发证日期、结束日期、发证地址(带拼音)、MRZ码第一行、MRZ码第二行、护照类型。
护照MRZ码识别 输入护照MRZ图像,输出11个信息,包括:类型、国家码、护照号、姓名、国籍、生日、性别、开始日期、结束日期、机器校验码1、机器校验码2,方便后续信息提取和证件审核。
资产类证件识别 营业执照识别 识别营业执照关键字段内容,包括:公司地址、营业范围、注册资本、注册日期、公司法人、公司名称、注册号、公司类型、公司营业期限日期,同时可输出营业执照上二维码、印章位置。
公章识别 识别图像中公章的位置,输出公章的机关、团体、企事业单位名称。
通用文字类识别 通用识别 识别图像中文字内容和文字区域坐标,适用于多场景图像文字识别。
表格识别 自动识别表格位置、表格内容信息。适用于黑色的,横线、竖线都齐全的表格中内容识别。
验证码识别 识别图像中验证码,输出验证码中的字母和数字。
文档结构化还原识别 对输入文档内容进行解析,输出结构化样式(html或者json)。
车辆交通类识别 驾驶证识别 识别驾驶证首页和副页关键字段内容,包括:档案编号、姓名、有效期时长、性别、发证日期、驾驶证号、驾驶证准驾车型、有效期开始时间、地址,共9个关键字段信息。
行驶证识别 识别行驶证首页和副页关键字段内容,输出品牌型号、车辆类型、车牌号码、检验记录、核定载质量、核定载人数等21个关键字段信息。
车牌识别 准确识别出图像中车牌位置,输出车牌位置坐标、车牌类型、车牌号码、车牌号码置信度、车牌置信度,共5个关键字段信息。
VIN码识别 识别车辆VIN码,输出车辆VIN码数值。
行业票证类识别 出租车发票识别 准确识别出全国各大城市出租车发票在图像中的位置,支持出租车发票结构化识别,输出发票号码、代码、车号、日期、时间、金额,共6个关键字段信息。
火车票识别 支持火车票结构化识别,输出乘车时间、始发站、目的站、座位席别、乘车人姓名、车次号、票价、车厢及座次号,共8个关键字段信息。
增值税发票识别 识别增值税发票(电子发票和纸质发票)关键字段内容,包括:校验码、复核人、开票人、发票代码、收款人等。
外卖单识别 识别外卖单上的关键字段内容,输出商店名称、电话、包装费、配送费、商品合计、其他费用合计、顾客优惠合计、总件数、在线支付、订单编号、下单时间等,目前支持饿了么外卖单。

应用场景

文字识别应用场景如下:
  • 注册登记审核

    互联网时代,许多应用都需要通过证件审核,认证访客的真实信息,从而提供更安全和高级的服务。通过身份证、护照、银行卡等能力可以快速准确的识别上传的证件,高达99%的识别准确率,可以提升审核效率,降低人工审核录入成本。

  • 报销凭证录入

    解决各种金融,医疗以及企业日常报销等场景的票据识别问题,通过诸如增值税发票、出租车发票、火车票等细分场景里的票证识别能力,可以实现高效、快速、低成本的各种行业票剧等识别与录入能力。

平台将持续更新迭代更多视觉AI能力,请您持续关注阿里云视觉智能开放平台