在离线环境下,支持在Android或iOS设备端实现通用文字的离线识别,包体小,可达到秒级识别速度。
说明 阿里云视觉智能开放平台各类目视觉AI能力SDK接入、接口使用或问题咨询等,请通过钉钉群(23109592)加入阿里云视觉智能开放平台咨询群联系我们。
能力优势
- 大文字库识别:支持6100余种识别能力,模型大小只有1.5 MB,覆盖绝大部分识别场景。
- 支持复杂场景:支持视频流识别模式,多帧识别避免了云端识别强依赖单张图片采集质量的问题,使用多帧融合策略进一步提升多字段场景的识别精度和识别速度,有效减少不可预测的外界因素(拍摄角度、光照等)带来的误识别。
- 精度与性能融合:离线识别在确保精度的前提下,保证在中低端机器中达到秒级的响应时间,精准快捷。
应用场景
- 通用文字识别:支持图书、杂志等各类文字识别场景。
- 身份证识别:支持中国内地二代身份证正反面识别。
- 驾驶证识别:支持机动车驾驶证主页、副页全部字段识别。
- 车辆信息识别:支持车牌、车辆VIN码识别。
前提条件
使用SDK前需完成激活授权,具体请参见激活授权。
计费说明
关于通用文字识别SDK的报价,请参见计费介绍。
支持终端
Android、iOS
约束与限制
- Android系统:Android 5.0以上,设备包含相机模块和陀螺仪模块。
- iOS系统:iOS 10以上,支持iPhone 5s以上系列机型,设备包含相机模块。
- 推荐相机分辨率:原生相机的分辨率大于640×480像素,小于1280×720像素。分辨率过大会降低SDK速度。
- 如需使用iOS系统iPhone 5s及以下、Android低端机型,请联系我们。
接入使用方式
重要 本SDK不会对SDK原厂商传输任何数据。因此,如果您使用本SDK收集个人信息,您将作为数据处理者,原厂商不作为数据处理者或受托处理者。您应当依照相关法律法规,对用户充分告知并获得授权。请您注意在告知用户时,原厂商不应作为数据处理者,亦不应作为受托处理者。
- Android:Android集成开发指南。
- iOS:iOS集成开发指南。