SDK总览
阿里云视觉智能开发平台目前支持人脸人体、文字识别、商品理解等10+类别的视觉AI技术,其中包括的上百种能力均可通过SDK方式调用。
说明
阿里云视觉智能开放平台各类目视觉AI能力SDK接入、接口使用或问题咨询等,请通过钉钉群(23109592)加入阿里云视觉智能开放平台咨询群联系我们。
前提条件
(可选)开通OSS服务。
注册阿里云账号并生成访问密钥(AccessKey)。详情请参见创建AccessKey。
SDK语言
视觉智能开放平台SDK支持Java、Python、Go、Node.js、PHP、C#六种常用语言,您可以选择对应语言类目下的视觉技术能力SDK进行接入。
各类目热门能力对应的常用语言和常见情况的示例代码,请参见下表。
类目 | 热门能力 |
交互式涂抹分割、交互式全图分割能力。 | |
人脸搜索1:N、图像人脸融合、人脸活体检测等能力。 | |
身份证识别、驾驶证识别、PDF识别等能力。 | |
商品分类。 | |
文本内容安全、图片内容安全。 | |
通用图像达标、元素识别、场景识别等能力。 | |
图片上色、字幕擦除、文生图等能力。 | |
人体分割、头像分割、商品分割等能力。 | |
主体检测、物体检测、猫鼠识别等能力。 | |
镜头解析、视频OCR、视频内容理解。 | |
通用视频生成、视频人脸融合、视频字幕擦除等能力。 | |
绿幕视频分割。 |
其他场景
除了服务端接入场景外,视觉智能开放平台也支持以下场景:
说明
由于调用阿里云视觉智能开放平台各类AI能力需要AccessKey ID和AccessKey Secret,平台推荐将代码放在您的服务端,其他场景下可能存在AccessKey ID和AccessKey Secret泄露风险,请自行评估风险范围。
签名方式调用
当前SDK暂未覆盖所有语言,在SDK覆盖语言之外的语言可以通过签名方式进行API的调用,详情请参见请求签名。