什么是文字识别_视觉智能开放平台(VIAPI)-阿里云帮助中心

备案控制台

输入文档关键字查找

文字识别技术基于阿里云深度学习技术，为您提供通用的印刷文字识别和文档结构化等能力。文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景，满足认证、鉴权、票据流转审核等业务需求。

服务开通

请单击立即开通在对应产品页面开通该服务，具体开通方式请参见新手指南。

能力介绍

目前阿里云视觉智能开放平台提供如下文字识别能力。

类别	能力	说明
个人类卡证识别	身份证识别	识别二代身份证关键字段内容，关键字段包括：姓名、性别、民族、身份证号、出生日期、地址信息、有效起始时间、签发机关，同时可输出身份证区域位置和人脸位置信息。
	银行卡识别	输入主流银行卡图像，输出3个信息，包括：发卡行、银行卡号、有效日期。
	二维码识别	识别图像中是否含有二维码信息，输出图像中二维码包含的文本信息（每个二维码对应的URL或文本），可支持图像中含有多个二维码识别。
资产类证件识别	营业执照识别	识别营业执照关键字段内容，包括：公司地址、营业范围、注册资本、注册日期、公司法人、公司名称、注册号、公司类型、公司营业期限日期，同时可输出营业执照上二维码、印章位置。
通用文字类识别	通用文字识别	识别图像中文字内容和文字区域坐标，适用于多场景图像文字识别。
	表格识别	自动识别表格位置、表格内容信息。适用于黑色的，横线、竖线都齐全的表格中内容识别。
	PDF识别	可以对PDF上的文字进行结构化识别。
	视频文字识别	可以实现对输入视频的结构化处理，返回对应的文字内容、文字区域坐标及时间等信息。
车辆交通类识别	驾驶证识别	识别驾驶证首页和副页关键字段内容，包括：档案编号、姓名、有效期时长、性别、发证日期、驾驶证号、驾驶证准驾车型、有效期开始时间、地址，共9个关键字段信息。
	行驶证识别	识别行驶证首页和副页关键字段内容，输出品牌型号、车辆类型、车牌号码、检验记录、核定载质量、核定载人数等21个关键字段信息。
	车牌识别	准确识别出图像中车牌位置，输出车牌位置坐标、车牌类型、车牌号码、车牌号码置信度、车牌置信度，共5个关键字段信息。
	VIN码识别	识别车辆VIN码，输出车辆VIN码数值。
行业票证类识别	出租车发票识别	准确识别出全国各大城市出租车发票在图像中的位置，支持出租车发票结构化识别，输出发票号码、代码、车号、日期、时间、金额，共6个关键字段信息。
	火车票识别	支持火车票结构化识别，输出乘车时间、始发站、目的站、座位席别、乘车人姓名、车次号、票价、车厢及座次号，共8个关键字段信息。
	增值税发票识别	可以识别增值税发票（电子发票和纸质发票）关键字段内容，包括：校验码、复核人、开票人、发票代码、收款人等。
	定额发票识别	可以对定额发票上的发票号码、发票代码、发票金额进行结构化识别。
	增值税发票卷票识别	支持对卷票上包括价税合计、发票代码、发票号码、合计税额、合计金额、密码区、开票日期、税率、购买方识别号、销售方识别号等结构化识别。

应用场景

文字识别应用场景如下：

注册登记审核
通过身份证、护照识别、银行卡识别等能力，在互联网金融、公共网上办事大厅等场景，能够快速准确识别录入用户身份、账户信息，准确率高达99%，从而降低用户输入成本，提高人工审核效率，有效控制业务风险。
报销凭证录入
应用于企业税务核算、金融保费核发及内部报销等场景，实现对各类税务发票、医疗发票、交通票据等的自动识别和快速录入，能够有效减少人力成本，实现报销的自动化。

更多产品动态，请您持续关注阿里云视觉智能开放平台。

上一篇：文字识别下一篇：文字识别计费介绍

文档内容是否对您有帮助？