阿里云视觉智能开发平台目前支持人脸人体、文字识别、商品理解等10+类别的视觉AI技术,其中包括的上百种能力均可通过SDK方式调用。

说明

阿里云视觉智能开放平台各类目视觉AI能力SDK接入、接口使用或问题咨询等,请通过钉钉群(23109592)加入阿里云视觉智能开放平台咨询群联系我们。

前提条件

SDK语言

视觉智能开放平台SDK支持JavaPythonGoNode.jsPHPC#六种常用语言,您可以选择对应语言类目下的视觉技术能力SDK进行接入。

各类目热门能力对应的常用语言和常见情况的示例代码,请参见下表。

类目

热门能力

创新专区

交互式涂抹分割、交互式全图分割能力。

人脸人体

人脸搜索1:N、图像人脸融合、人脸活体检测等能力。

文字识别

身份证识别、驾驶证识别、PDF识别等能力。

商品理解

商品分类。

内容审核

文本内容安全、图片内容安全。

图像识别

通用图像达标、元素识别、场景识别等能力。

图像生产

图片上色、字幕擦除、文生图等能力。

分割抠图

人体分割、头像分割、商品分割等能力。

目标检测

主体检测、物体检测、猫鼠识别等能力。

视频理解

镜头解析、视频OCR、视频内容理解。

视频生产

通用视频生成、视频人脸融合、视频字幕擦除等能力。

视频分割

绿幕视频分割。

其他场景

除了服务端接入场景外,视觉智能开放平台也支持以下场景:

说明

由于调用阿里云视觉智能开放平台各类AI能力需要AccessKey ID和AccessKey Secret,平台推荐将代码放在您的服务端,其他场景下可能存在AccessKey ID和AccessKey Secret泄露风险,请自行评估风险范围。

签名方式调用

当前SDK暂未覆盖所有语言,在SDK覆盖语言之外的语言可以通过签名方式进行API的调用,详情请参见请求签名

说明

使用签名机制调用,文件参数当前系统推荐使用上海OSS链接,可参见开通OSS服务文档将文件放入到上海OSS中。如果是其他情况(如本地文件或者其他链接),您需要将显示地转换成上海OSS链接,可参见文件URL处理的方式二。