产品简介
阿里云视觉智能开放平台提供通用文字识别、证件识别、图片分割等离线SDK,可通过无网络环境下离线使用,不同能力支持Android、iOS、Windows和macOS不同的适用终端。本文为您介绍阿里云视觉智能开放平台当前支持的离线SDK能力。
阿里云视觉智能开放平台各类目视觉AI能力SDK接入、接口使用或问题咨询等,请通过钉钉群(23109592)加入阿里云视觉智能开放平台咨询群联系我们。
能力介绍
能力名称 |
支持终端 |
描述 |
实时视频分割 |
实时视频分割SDK(Android) |
基于深度学习框架,结合检测识别技术,实现高精视觉分割能力,可实现实时全自动主体、场景像素级识别,对高度镂空主体、复杂背景等场景都有较好的效果。 |
实时视频分割SDK (iOS) |
||
实时视频分割SDK (Windows) |
||
实时视频分割SDK (macOS) |
||
离线图片分割 |
离线图片分割SDK(Android) |
通过检测识别技术,对用户拍照或上传的图片进行精细化、无瑕疵的抠像处理,实现高精视觉分割能力,支持复杂图片背景的分割和替换。 |
离线图片分割SDK(iOS) |
||
实时无损分割 |
实时无损分割SDK(Windows) |
通过颜色过滤和深度学习的融合技术,对直播中的视频进行实时分割,同时对边缘瑕疵进行边缘平滑和去杂色处理,实现影视级无瑕疵的实时视频分割效果。 |
实时无损分割SDK(macOS) |
||
离线视频分割 |
离线视频分割SDK(Android) |
基于客户端自身计算资源,对采集的视频实现视频图像序列化分割。 |
离线视频分割SDK(iOS) |
||
文字离线识别 |
证件识别SDK(Android) |
支持身份证、驾驶证、行驶证正反面离线识别,可识别常用多个关键字段内容,识别精准度超过95%。 |
证件识别SDK(iOS) |
||
车辆类识别SDK(Android) |
支持扫描识别中国内地所有单行车牌及VIN码的识别,支持以视频流形式的识别。 |
|
车辆类识别SDK(iOS) |
||
通用文字识别SDK(Android) |
在离线环境下,支持在Android或iOS设备端实现通用文字、身份卡证、驾驶卡证和车牌的离线识别,同时包体很小,可达到秒级识别速度。 |
|
通用文字识别SDK(iOS) |
||
肢体关键点 |
肢体关键点SDK(Android) |
可识别授权人体图像的15个关键点检测信息,包括鼻子,眼睛,脖子,左肩,右肩等。 |
肢体关键点SDK(iOS) |
||
肢体动作计数 |
肢体动作计数SDK(Android) |
通过摄像头拍摄人像动作视频,实时识别出人体关键点,并根据动作自动计数。已支持的健身动作有15种(跳绳、深蹲、开合跳、仰卧起坐、俯卧撑、平板支撑、臀桥等),还可支持定制健身动作。 |
肢体动作计数SDK(iOS) |
||
肢体动作计数反馈机制 |
肢体动作计数反馈机制SDK(Android) |
通过AI实时检测,可检测出15种不规范的肢体动作,同时可实现实时反馈。 |
肢体动作计数反馈机制SDK(iOS) |
||
服务端人脸识别 |
服务端人脸识别SDK(Linux) |
服务端人脸识别离线SDK,包括人脸检测、人脸跟踪、人脸关键点定位、人脸质量、角度模型、活体检测和人脸识别等能力,可以直接部署服务器上。 |
人脸关键点 |
人脸关键点SDK(Android) |
可快速识别出图像中人脸数量和人脸区域,输出人脸数量、106个基础点位坐标、134个额外精细点位、40个眼瞳点位等信息。 |
人脸关键点SDK(iOS) |
||
图片增强 |
图片增强SDK(Android) |
将原图进行无损放大一倍效果,保持图像质量无损。 |
图片增强SDK(iOS) |
||
滤镜 |
滤镜SDK(Android) |
提供8种滤镜效果,正常,活力,清新,美食,日系,美颜,薄荷,黑白。保证图片质量的前提下达到相应的滤镜效果。 |
滤镜SDK(iOS) |
||
基础美颜 |
基础美颜SDK(Android) |
基于人脸检测,可以对图像质感、人像肤质、色调进行自由调节,从而达到均衡肤色、消除面部瑕疵、美化人脸的功效。 |
基础美颜SDK(iOS) |
||
视频增强 |
视频增强SDK(Android) |
基于多维视频增强算法,对视频画面进行清晰度提升、噪声抑制、损伤问题修复、色彩显示提升,使视频在实时播放、离线编辑的场景下获得显著的画质增强,提升用户体验,同时降低带宽传输成本。 |
视频增强SDK(iOS) |
||
动作打分 |
动作打分SDK(Android) |
通过人体姿态估计以及动作打分算法,对人物动作标准度进行打分。支持复杂自遮挡类动作,鲁棒性高。 |
动作打分SDK(iOS) |
||
疲劳检测 |
疲劳检测SDK(Android) |
识别图像中的人脸,检测识别驾驶员驾驶状态,进一步识别行为属性,可识别闭眼和打哈欠等疲劳行为,分析预警危险驾驶行为。 |
疲劳检测SDK(iOS) |
||
手势识别 |
手势识别SDK(Android) |
检测图片中的手部位置和手势类型,支持自拍、他人拍摄、各种拍摄角度。可识别13种常见手势。 |
手势识别SDK(iOS) |
||
人脸对比 |
人脸对比SDK(Android) |
两张人脸进行 1:1 比对,得到人脸相似度,支持生活照、证件照、身份证芯片照、带网纹照、红外黑白照5种图片类型的人脸对比。 |
人脸对比SDK(iOS) |
||
唇动检测 |
唇动检测SDK(Android) |
对图片中的人脸进行定位,并对唇动的程度进行检测,输出用户唇动的大小,可应用于多模态场景,和语音算法一起降低传统语音唤醒算法的误唤醒。 |
唇动检测SDK(iOS) |
||
坐姿检测 |
坐姿检测SDK(Android) |
检测图像中用户的坐姿,返回坐姿是否标准,可用于对儿童学习坐姿进行检测和纠正,实现学习看护能力。 |
坐姿检测SDK(iOS) |
||
学习行为识别 |
学习行为识别SDK(Android) |
检测图像中用户的行为,根据用户行为输出用户是否处于学习中,可用于对儿童学习进行看护和监督,配合坐姿检测实现学习看护能力。 |
学习行为识别SDK(iOS) |
||
指尖查词 |
指尖查词SDK(Android) |
检测图片中指尖位置,识别指尖指向的中文字、词语或英文单词,帮助学生进行中英文生字、生词的查询和教学。 |
指尖查词SDK(iOS) |