阿里云首页 文字识别(OCR) 相关技术圈

新手指引

本文为新用户提供OCR学习指引。

1. 选择所需的OCR产品服务

按您特定场景选择所需产品:

通用文字识别

个人证照识别

票据凭证识别

教育场景识别

车辆物流识别

企业资质识别

小语种识别

您可通过读光体验馆快速可视化地体验产品服务效果,若上述需求均无法满足,可添加钉钉群35208328进行沟通反馈,感谢!

2. 了解OCR产品定价与计费

阿里云文字识别的计费模式分为资源包的预付费模式按量计费的后付费模式。您需要全面了解文字识别的计费模式,有利于您选择最优的计费方案。

计费概述

按量付费

资源包

3. OCR服务指引

3.1 注册账号

在使用阿里云文字识别服务前,您需要先注册阿里云账号并完成实名认证,可参考《阿里云账号注册流程》。

3.2 开通服务

若您需要使用按量付费的后付费模式,则选择您所需的OCR后付费商品服务开通,总共有7大商品类型。开通服务免费,且开通后即可享每月200次的免费调用额度。您可前往文字识别的产品详情页产品控制台进行服务开通。

若您需要使用资源包进行采购,需要先开通对应的后付费服务,资源包总共也有7大商品类型,与后付费相互对应,而后前往产品详情页产品控制台进行购买。

警告

需要声明的是,云市场的资源包无法直接进行官网后付费的资源抵扣,因两个售卖渠道不同,计费方式不同,敬请谅解。云市场和官网分别享受各自的免费额度。

官网有官网自有的资源包商品,可使用官网的资源包进行后付费的资源抵扣,扣费顺序为免费额度—>资源包额度—>后付费。详情可参看产品公告

3.3 产品试用

方法一:体验测试

体验测试适用于业务方、采购人员、产品经理、研发人员等角色,毋需代码接入即可进行可视化的产品体验,降低调研与决策成本。

测试方法:点击读光体验馆,选择所需的产品并在体验馆中上传测试图片或者添加URL地址进行图片解析,右侧为返回的结果。

体验馆
  • 一次仅可上传一张图片,若需要测试多少图片可多次上传查看;

  • 上传的图片格式为:.jpg/.jpeg/.png/.bmp./gif./tiff./webp,请注意图片大小不超过10M,最长边不超过4096像素;

  • 根据场景不同返回的结果略有不同,如全文识别返回与结构化识别返回。若需测试全文识别结果,建议使用全文识别高精版进行OCR测试;

方法二:批量测试

该测试方法适用于研发人员,需要接口接入进行批量评测。每个接口提供了每月200次免费额度进行小批量的API调用测试。

3.4 正式接入API

若上述测试结果符合您的预期,则可直接正式使用,已经接入了的无需重复接入,根据所需产品的SDK说明调用即可。若有调用疑问,可添加钉钉群35208328进行反馈,感谢配合

4. API接口文档

阿里云文字识别服务在官网和云市场的售卖渠道因网关不同接口存在差异,具体可参考下述快捷比对:

场景分类

官网API接口(新)

云市场API接口(旧)

通用文字识别

通用文字识别

包含如下接口:

RecognizeTableOcr

RecognizeHealthCode

  • 通信行程码识别

RecognizeTravelCard

通用文字识别

个人证照识别

个人证照识别

包含如下接口:

  • 身份证识别

RecognizeIdcard

RecognizePassport

RecognizeChinesePassport

个人证照识别

票据凭证识别

发票凭证识别

包含如下接口:

票据凭证识别

教育试卷识别

教育试题识别

包含如下接口:

教育试题识别

车辆物流识别

车辆物流识别

包含如下接口:

车辆物流识别

企业资质识别

企业资质识别

包含如下接口:

企业资质识别

小语种文字识别

小语种文字识别

包含如下接口:

RecognizeThai

RecognizeKorean

  • 俄语识别

RecognizeRussian

  • 拉丁语识别

RecognizeLatin

小语种文字识别

5. 常见问题

6. 意见与反馈

使用阿里云文字识别产品和服务中有任何问题或建议,您可以通过以下渠道反馈,将有专人跟进解决您的问题:

  • 如果您在产品使用过程中有任何疑问,可以添加钉钉群:35208328进行沟通反馈;

  • 若有定制化需求沟通,可以在线进行客服咨询,我们将竭力为您解答;