本章节介绍阿里云文字识别-票据凭证识别系列相关产品。
产品介绍
基于OCR技术,票据凭证系列提供财税报销、税务核算所需的各类发票结构化识别,包括增值税发票、增值税发票卷票、火车票、定额发票、航空行程单、出租车发票、通用机打发票、过路过桥发票、客运车船票、银行承兑汇票等近二十种常见发票,及混贴发票的自动分割与识别能力。
产品功能
混贴发票识别
基于达摩院强大的深度学习算法和结构化模板优化技术,确保各字段精度均处于业界领先水平,其中各类票据的发票代码、价税合计、合计金额、购买方识别号、开票日期等关键字段结构化识别输出,识别准确率超过99%。
网约车行程单识别
读光OCR网约车行程单识别,已支持网约车行程单全部字段的识别,包括:服务商、申请日期、行程开始时间、行程结束时间、行程人手机号、总金额等字段,识别准确率达到96%以上。
增值税发票识别
读光OCR支持增值税专用发票、增值税普通发票、增值税电子发票识别,支持包括发票代码、发票号码、开票日期、发票金额、发票税额、检验码、购买方税号、销售方税号、发票详情等关键字段结构化识别输出,识别准确率超过99%。
火车票识别
读光OCR火车票识别,支持包括票号、出发站、到达站、开车时间、票价、座位类型、旅客信息、座位号、车次等字段结构化识别输出。其中火车票关键字段姓名、出发时间、出发站、识别、座位号等识别准确率超过96%。
定额发票识别
读光OCR定额发票支持包括发票号码、发票代码、发票金额等关键字段结构化识别输出。
航空行程单识别
读光OCR航空运输电子行程单识别,支持包括旅客姓名、身份证号码、电子客票号码、填开日期、填开单位等字段结构化识别输出。
出租车发票识别
读光OCR出租车机打发票识别,支持包括发票代码、发票号码、日期、发票金额等关键字段结构化识别输出,其中发票代码、发票号码等关键字段识别准确率超过95%。
增值税发票卷票识别
读光OCR增值税发票卷票识别,支持对卷票上包括发票代码、发票号码、开票日期、发票金额、校验码、大写金额、销售方税号、购买方税号等关键字段结构化识别输出。
机动车销售统一发票识别
读光OCR机动车统一销售发票识别,针对购车发票支持包括发票代码、开票号码、开票日期、发票金额、增值税税额、合格证号、购买方名称、购买方身份证号/代码等关键字段结构化识别输出。
二手车销售统一发票识别
读光OCR二手车销售统一发票识别,针对二手车购车发票支持包括发票代码、发票号码、开票日期、发票金额、购买方名称、购买方身份证号等关键字段结构化识别输出。
通用机打发票识别
读光OCR通用机打发票识别,支持包括发票代码、发票号码、销售方名称、销售方识别号、购买方名称、购买方识别号、合计金额等关键字段结构化识别输出。
过路过桥发票识别
读光OCR过路过桥费发票识别,支持包括发票代码、发票号码、金额、日期、车型、出口、入口等关键字段结构化识别输出,准确率超过95%。
客运车船票识别
读光OCR客运车船票识别,支持包括标题、发票号码、出发车站、到达车站、日期、金额等关键字段结构化识别输出。
税收完税证明识别
读光OCR税收完税证明识别,支持包括税务机关、纳税人识别号、纳税人名称、合计金额、填票人、完税详单等关键字段的结构化识别输出,准确率超过98%。
电商订单页识别
读光OCR电商订单页识别,支持包括订单编号、收货信息、交易金额、店铺名称、商品详单等关键字段结构化识别输出。
支付详情页识别
读光OCR支付详情页识别,支持包括收款方名称、合计金额、付款方式、商品说明、支付时间等关键字段结构化识别输出。
非税收入发票识别
读光OCR非税收入发票识别,支持包括票据代码、交款人、票据号码、合计金额、收款单位等关键字段结构化识别输出,准确率超过97%。
酒店流水识别
读光OCR酒店流水识别,支持包括房号、入住日期、离店日期、消费总计、付款总计、消费详单等关键字段结构化识别输出。
购物小票识别
读光OCR购物小票识别,支持包括开票方名称、开票日期、联系电话、地址、合计(实际)金额等关键字段结构化识别输出。
银行承兑汇票识别
读光OCR银行承兑汇票识别,支持包括出票日期、票据号码、出票人信息、收票人信息、承兑人信息、票据金额等关键字段结构化识别输出。
发票核验
读光OCR支持5种增值税发票的真伪核验(不支持发票内容识别),包括增值税专用发票、增值税普通发票、区块链发票(深圳地区)、机动车销售统一发票、二手车销售统一发票。核验前请核对所需的发票字段,手动输入进行核验。发票开票日期须在近5年内,开票后次日可查验。
产品详情请查看票证核验。
特色优势
准确率高:利用海量的图片样本训练模型,具有业内领先的准确率。
实时性高:依托于阿里自建的EAS在线服务集群,精益求精优化Inference技术,提供弹性伸缩的低延时服务
技术前沿精深:基于阿里云人工智能平台 PAI,应用阿里深度优化的深度学习框架PAI-Tensorflow,训练出业界领先的文本检测模型及文本识别模型。
服务稳定:根据调用量提供弹性服务,扩展性好,算法持续的迭代优化对用户稳定性无影响。
应用场景
财务报销:实现对各类税务发票、交通票据等的自动识别和录入。能够有效减少人工核算工作量,降低人力成本,实现财税报销的自动化。
移动投保:对各类保险单据中的有效信息进行结构化提取,应用于保单审核、保费核发等场景。有效提升信息录入效率,减少人工核算工作量,降低人力成本。
财务共享:可用于费用报销和支出控制共享、资金结算共享、税务和发票管理共享。有效提升信息录入效率,减少人工核算工作量,降低人力成本。
API快捷入口
云市场API快捷入口(旧) | 官网API快捷入口(新) |
税收完税证明识别 | |
网约车行程单识别 | |
过路过桥费发票识别 | |
通用机打发票识别 | |
客运车船票识别 | |
电商订单页识别 | |
酒店流水识别 | |
支付详情页识别 | |
非税收入发票识别 | |
购物小票识别 |