通用文字识别SDK

更新时间:
复制为 MD 格式

在离线环境下,支持在AndroidiOS设备端实现通用文字的离线识别,包体小,可达到秒级识别速度。

说明

阿里云视觉智能开放平台离线SDK产品,自2026512日起不再进行新增license授权。历史已购买这些服务的老用户仍然可继续使用,之后不再进行新增license授权。

能力优势

  • 大文字库识别:支持6100余种识别能力,模型大小只有1.5 MB,覆盖绝大部分识别场景。

  • 支持复杂场景:支持视频流识别模式,多帧识别避免了云端识别强依赖单张图片采集质量的问题,使用多帧融合策略进一步提升多字段场景的识别精度和识别速度,有效减少不可预测的外界因素(拍摄角度、光照等)带来的误识别。

  • 精度与性能融合:离线识别在确保精度的前提下,保证在中低端机器中达到秒级的响应时间,精准快捷。

应用场景

  • 通用文字识别:支持图书、杂志、证件等各类文字识别场景。

前提条件

使用SDK前需完成激活授权,具体请参见激活并授权离线SDK

计费说明

关于通用文字识别SDK的报价,请参见离线SDK计费介绍

支持终端

Android、iOS

约束与限制

  • Android系统:Android 5.0以上,设备包含相机模块和陀螺仪模块。

  • iOS系统:iOS 10以上,支持iPhone 5s以上系列机型,设备包含相机模块。

  • 推荐相机分辨率:原生相机的分辨率大于640×480像素,小于1280×720像素。分辨率过大会降低SDK速度。

  • 如需使用iOS系统iPhone 5s及以下、Android低端机型,请联系我们

接入使用方式

重要

SDK不会对SDK原厂商传输任何数据。因此,如果您使用本SDK收集个人信息,您将作为数据处理者,原厂商不作为数据处理者或受托处理者。您应当依照相关法律法规,对用户充分告知并获得授权。请您注意在告知用户时,原厂商不应作为数据处理者,亦不应作为受托处理者。