离线视觉AI能力SDK-离线SDK-视觉智能开放平台-阿里云

阿里云视觉智能开放平台提供通用文字识别、证件识别、图片分割等离线SDK，可在无网络环境下离线使用，不同能力支持Android、iOS、Windows和macOS不同的使用终端。本文为您介绍阿里云视觉智能开放平台当前支持的离线SDK能力。

说明

阿里云视觉智能开放平台各类目视觉AI能力SDK接入、接口使用或问题咨询等，请通过钉钉群（23109592）加入阿里云视觉智能开放平台咨询群联系我们。

能力介绍

能力名称	支持终端	描述
实时视频分割	实时视频分割SDK（Android）	基于深度学习框架，结合检测识别技术，实现高精视觉分割能力，可实现实时全自动主体、场景像素级识别，对高度镂空主体、复杂背景等场景都有较好的效果。
	实时视频分割SDK （iOS）
	实时视频分割SDK （Windows）
	实时视频分割SDK （macOS）
离线图片分割	离线图片分割SDK（Android）	通过检测识别技术，对用户拍照或上传的图片进行精细化、无瑕疵的抠像处理，实现高精视觉分割能力，支持复杂图片背景的分割和替换。
	离线图片分割SDK（iOS）
实时无损分割	实时无损分割SDK（Windows）	通过颜色过滤和深度学习的融合技术，对直播中的视频进行实时分割，同时对边缘瑕疵进行边缘平滑和去杂色处理，实现影视级无瑕疵的实时视频分割效果。
	实时无损分割SDK（macOS）
离线视频分割	离线视频分割SDK（Android）	基于客户端自身计算资源，对采集的视频实现视频图像序列化分割。
	离线视频分割SDK（iOS）
文字离线识别	证件识别SDK（Android）	支持身份证、驾驶证、行驶证正反面离线识别，可识别常用多个关键字段内容，识别精准度超过95%。
	证件识别SDK（iOS）
	车辆类识别SDK（Android）	支持扫描识别中国内地所有单行车牌及VIN码的识别，支持以视频流形式的识别。
	车辆类识别SDK（iOS）
	通用文字识别SDK（Android）	在离线环境下，支持在Android或iOS设备端实现通用文字、身份卡证、驾驶卡证和车牌的离线识别，同时包体很小，可达到秒级识别速度。
	通用文字识别SDK（iOS）
肢体关键点	肢体关键点SDK（Android）	可识别授权人体图像的15个关键点检测信息，包括鼻子，眼睛，脖子，左肩，右肩等。
	肢体关键点SDK（iOS）
肢体动作计数	肢体动作计数SDK（Android）	通过摄像头拍摄人像动作视频，实时识别出人体关键点，并根据动作自动计数。已支持的健身动作有15种（跳绳、深蹲、开合跳、仰卧起坐、俯卧撑、平板支撑、臀桥等），还可支持定制健身动作。
	肢体动作计数SDK（iOS）
肢体动作计数反馈机制	肢体动作计数反馈机制SDK（Android）	通过AI实时检测，可检测出15种不规范的肢体动作，同时可实现实时反馈。
	肢体动作计数反馈机制SDK（iOS）
服务端人脸识别	服务端人脸识别SDK（Linux）	服务端人脸识别离线SDK，包括人脸检测、人脸跟踪、人脸关键点定位、人脸质量、角度模型、活体检测和人脸识别等能力，可以直接部署在服务器上。
图片增强	图片增强SDK（Android）	将原图进行无损放大一倍效果，保持图像质量无损。
	图片增强SDK（iOS）
滤镜	滤镜SDK（Android）	提供8种滤镜效果，正常，活力，清新，美食，日系，美颜，薄荷，黑白。保证图片质量的前提下达到相应的滤镜效果。
	滤镜SDK（iOS）
基础美颜	基础美颜SDK（Android）	基于人脸检测，可以对图像质感、人像肤质、色调进行自由调节，从而达到均衡肤色、消除面部瑕疵、美化人脸的功效。
	基础美颜SDK（iOS）
视频增强	视频增强SDK（Android）	基于多维视频增强算法，对视频画面进行清晰度提升、噪声抑制、损伤问题修复、色彩显示提升，使视频在实时播放、离线编辑的场景下获得显著的画质增强，提升用户体验，同时降低带宽传输成本。
	视频增强SDK（iOS）