产品简介

阿里云视觉智能开放平台提供通用文字识别、证件识别、图片分割等离线SDK,可在无网络环境下离线使用,不同能力支持Android、iOS、Windows和macOS不同的使用终端。本文为您介绍阿里云视觉智能开放平台当前支持的离线SDK能力。

说明

阿里云视觉智能开放平台各类目视觉AI能力SDK接入、接口使用或问题咨询等,请通过钉钉群(23109592)加入阿里云视觉智能开放平台咨询群联系我们。

能力介绍

能力名称

支持终端

描述

实时视频分割

实时视频分割SDK(Android)

基于深度学习框架,结合检测识别技术,实现高精视觉分割能力,可实现实时全自动主体、场景像素级识别,对高度镂空主体、复杂背景等场景都有较好的效果。

实时视频分割SDK (iOS)

实时视频分割SDK (Windows)

实时视频分割SDK (macOS)

离线图片分割

离线图片分割SDK(Android)

通过检测识别技术,对用户拍照或上传的图片进行精细化、无瑕疵的抠像处理,实现高精视觉分割能力,支持复杂图片背景的分割和替换。

离线图片分割SDK(iOS)

实时无损分割

实时无损分割SDK(Windows)

通过颜色过滤和深度学习的融合技术,对直播中的视频进行实时分割,同时对边缘瑕疵进行边缘平滑和去杂色处理,实现影视级无瑕疵的实时视频分割效果。

实时无损分割SDK(macOS)

离线视频分割

离线视频分割SDK(Android)

基于客户端自身计算资源,对采集的视频实现视频图像序列化分割。

离线视频分割SDK(iOS)

文字离线识别

证件识别SDK(Android)

支持身份证、驾驶证、行驶证正反面离线识别,可识别常用多个关键字段内容,识别精准度超过95%。

证件识别SDK(iOS)

车辆类识别SDK(Android)

支持扫描识别中国内地所有单行车牌及VIN码的识别,支持以视频流形式的识别。

车辆类识别SDK(iOS)

通用文字识别SDK(Android)

在离线环境下,支持在Android或iOS设备端实现通用文字、身份卡证、驾驶卡证和车牌的离线识别,同时包体很小,可达到秒级识别速度。

通用文字识别SDK(iOS)

肢体关键点

肢体关键点SDK(Android)

可识别授权人体图像的15个关键点检测信息,包括鼻子,眼睛,脖子,左肩,右肩等。

肢体关键点SDK(iOS)

肢体动作计数

肢体动作计数SDK(Android)

通过摄像头拍摄人像动作视频,实时识别出人体关键点,并根据动作自动计数。已支持的健身动作有15种(跳绳、深蹲、开合跳、仰卧起坐、俯卧撑、平板支撑、臀桥等),还可支持定制健身动作。

肢体动作计数SDK(iOS)

肢体动作计数反馈机制

肢体动作计数反馈机制SDK(Android)

通过AI实时检测,可检测出15种不规范的肢体动作,同时可实现实时反馈。

肢体动作计数反馈机制SDK(iOS)

服务端人脸识别

服务端人脸识别SDK(Linux)

服务端人脸识别离线SDK,包括人脸检测、人脸跟踪、人脸关键点定位、人脸质量、角度模型、活体检测和人脸识别等能力,可以直接部署在服务器上。

人脸关键点

人脸关键点SDK(Android)

可快速识别出图像中人脸数量和人脸区域,输出人脸数量、106个基础点位坐标、134个额外精细点位、40个眼瞳点位等信息。

人脸关键点SDK(iOS)

图片增强

图片增强SDK(Android)

将原图进行无损放大一倍效果,保持图像质量无损。

图片增强SDK(iOS)

滤镜

滤镜SDK(Android)

提供8种滤镜效果,正常,活力,清新,美食,日系,美颜,薄荷,黑白。保证图片质量的前提下达到相应的滤镜效果。

滤镜SDK(iOS)

基础美颜

基础美颜SDK(Android)

基于人脸检测,可以对图像质感、人像肤质、色调进行自由调节,从而达到均衡肤色、消除面部瑕疵、美化人脸的功效。

基础美颜SDK(iOS)

视频增强

视频增强SDK(Android)

基于多维视频增强算法,对视频画面进行清晰度提升、噪声抑制、损伤问题修复、色彩显示提升,使视频在实时播放、离线编辑的场景下获得显著的画质增强,提升用户体验,同时降低带宽传输成本。

视频增强SDK(iOS)

动作打分

动作打分SDK(Android)

通过人体姿态估计以及动作打分算法,对人物动作标准度进行打分。支持复杂自遮挡类动作,鲁棒性高。

动作打分SDK(iOS)