阿里云视觉智能开放平台提供通用文字识别、证件识别、图片分割等离线SDK,可在无网络环境下离线使用,不同能力支持Android、iOS、Windows和macOS不同的使用终端。本文为您介绍阿里云视觉智能开放平台当前支持的离线SDK能力。
阿里云视觉智能开放平台各类目视觉AI能力SDK接入、接口使用或问题咨询等,请通过钉钉群(23109592)加入阿里云视觉智能开放平台咨询群联系我们。
能力介绍
能力名称 | 支持终端 | 描述 |
实时视频分割 | 实时视频分割SDK(Android) | 基于深度学习框架,结合检测识别技术,实现高精视觉分割能力,可实现实时全自动主体、场景像素级识别,对高度镂空主体、复杂背景等场景都有较好的效果。 |
实时视频分割SDK (iOS) | ||
实时视频分割SDK (Windows) | ||
实时视频分割SDK (macOS) | ||
离线图片分割 | 离线图片分割SDK(Android) | 通过检测识别技术,对用户拍照或上传的图片进行精细化、无瑕疵的抠像处理,实现高精视觉分割能力,支持复杂图片背景的分割和替换。 |
离线图片分割SDK(iOS) | ||
实时无损分割 | 实时无损分割SDK(Windows) | 通过颜色过滤和深度学习的融合技术,对直播中的视频进行实时分割,同时对边缘瑕疵进行边缘平滑和去杂色处理,实现影视级无瑕疵的实时视频分割效果。 |
实时无损分割SDK(macOS) | ||
离线视频分割 | 离线视频分割SDK(Android) | 基于客户端自身计算资源,对采集的视频实现视频图像序列化分割。 |
离线视频分割SDK(iOS) | ||
文字离线识别 | 证件识别SDK(Android) | 支持身份证、驾驶证、行驶证正反面离线识别,可识别常用多个关键字段内容,识别精准度超过95%。 |
证件识别SDK(iOS) | ||
车辆类识别SDK(Android) | 支持扫描识别中国内地所有单行车牌及VIN码的识别,支持以视频流形式的识别。 | |
车辆类识别SDK(iOS) | ||
通用文字识别SDK(Android) | 在离线环境下,支持在Android或iOS设备端实现通用文字、身份卡证、驾驶卡证和车牌的离线识别,同时包体很小,可达到秒级识别速度。 | |
通用文字识别SDK(iOS) | ||
肢体关键点 | 肢体关键点SDK(Android) | 可识别授权人体图像的15个关键点检测信息,包括鼻子,眼睛,脖子,左肩,右肩等。 |
肢体关键点SDK(iOS) | ||
肢体动作计数 | 肢体动作计数SDK(Android) | 通过摄像头拍摄人像动作视频,实时识别出人体关键点,并根据动作自动计数。已支持的健身动作有15种(跳绳、深蹲、开合跳、仰卧起坐、俯卧撑、平板支撑、臀桥等),还可支持定制健身动作。 |
肢体动作计数SDK(iOS) | ||
肢体动作计数反馈机制 | 肢体动作计数反馈机制SDK(Android) | 通过AI实时检测,可检测出15种不规范的肢体动作,同时可实现实时反馈。 |
肢体动作计数反馈机制SDK(iOS) | ||
服务端人脸识别 | 服务端人脸识别SDK(Linux) | 服务端人脸识别离线SDK,包括人脸检测、人脸跟踪、人脸关键点定位、人脸质量、角度模型、活体检测和人脸识别等能力,可以直接部署在服务器上。 |
人脸关键点 | 人脸关键点SDK(Android) | 可快速识别出图像中人脸数量和人脸区域,输出人脸数量、106个基础点位坐标、134个额外精细点位、40个眼瞳点位等信息。 |
人脸关键点SDK(iOS) | ||
图片增强 | 图片增强SDK(Android) | 将原图进行无损放大一倍效果,保持图像质量无损。 |
图片增强SDK(iOS) | ||
滤镜 | 滤镜SDK(Android) | 提供8种滤镜效果,正常,活力,清新,美食,日系,美颜,薄荷,黑白。保证图片质量的前提下达到相应的滤镜效果。 |
滤镜SDK(iOS) | ||
基础美颜 | 基础美颜SDK(Android) | 基于人脸检测,可以对图像质感、人像肤质、色调进行自由调节,从而达到均衡肤色、消除面部瑕疵、美化人脸的功效。 |
基础美颜SDK(iOS) | ||
视频增强 | 视频增强SDK(Android) | 基于多维视频增强算法,对视频画面进行清晰度提升、噪声抑制、损伤问题修复、色彩显示提升,使视频在实时播放、离线编辑的场景下获得显著的画质增强,提升用户体验,同时降低带宽传输成本。 |
视频增强SDK(iOS) | ||
动作打分 | 动作打分SDK(Android) | 通过人体姿态估计以及动作打分算法,对人物动作标准度进行打分。支持复杂自遮挡类动作,鲁棒性高。 |
动作打分SDK(iOS) |