ImageModeration - 图片审核增强版

更新时间:
复制为 MD 格式

图片审核

接口说明

请确保在使用该接口前完成以下操作:

  1. 开通内容安全增强版

  2. 充分了解图片审核增强版产品的收费方式和价格

  3. 更多接口使用和参数请参考 API 接口文档

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

调试

授权信息

下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:

  • 操作:是指具体的权限点。

  • 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。

  • 资源类型:是指操作中支持授权的资源类型。具体说明如下:

    • 对于必选的资源类型,用前面加 * 表示。

    • 对于不支持资源级授权的操作,用全部资源表示。

  • 条件关键字:是指云产品自身定义的条件关键字。

  • 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。

操作

访问级别

资源类型

条件关键字

关联操作

yundun-greenweb:ImageModeration

get

*全部资源

*

请求参数

名称

类型

必填

描述

示例值

Service

string

图片审核增强版支持的检测类型。取值:

  • baselineCheck:通用基线检测

  • baselineCheck_pro:通用基线检测_专业版

  • baselineCheck_cb:通用基线检测_海外版

  • tonalityImprove:内容治理检测

  • aigcCheck:AIGC 图片检测

  • aigcViolationDetection:AIGC 图片侵权检测

  • aigcDetector:图片是否 AIGC 生成判定

  • profilePhotoCheck:头像图片检测

  • postImageCheck:帖子评论图片检测

  • advertisingCheck:营销素材检测

  • liveStreamCheck:视频/直播截图检测

  • generalOcr:通用图文 OCR

  • generalRecognition:图片万物识别

  • postImageCheckByVL:大小模型融合图片审核服务

  • postImageCheckByVL_cb:大小模型融合图片审核服务_出海版

  • baselineCheckByVL:通用图片审核大模型服务

枚举值:

  • liveStreamCheck :

    视频截图检测

  • generalOcr :

    通用图文 OCR

  • postImageCheck :

    帖子评论图片检测

  • postImageCheckByVL_cb :

    大小模型融合图片审核服务_出海版

  • baselineCheck_pro :

    通用基线检测_专业版

  • advertisingCheck :

    营销素材检测

  • baselineCheck_cb :

    通用基线检测_出海版

  • tonalityImprove :

    内容治理检测

  • profilePhotoCheck :

    头像图片检测

  • baselineCheck :

    通用基线检测

  • postImageCheckByVL :

    大小模型融合图片审核服务

  • generalRecognition :

    图片万物识别

  • aigcCheck :

    AIGC 图片检测

  • aigcViolationDetection :

    AIGC 图片侵权检测

  • baselineCheckByVL :

    通用图片审核大模型服务

  • aigcDetector :

    图片是否 AIGC 生成判定

baselineCheck

ServiceParameters

string

内容检测对象的相关参数集。JSON 字符串格式。

  • imageUrl:待检测对象的 URL,必填。

  • dataId:检测对象对应的数据 ID,可选。

  • referer:referer 请求头,用于防盗链等场景,可选。

{"imageUrl":"https://img.alicdn.com/tfs/TB1U4r9AeH2gK0jSZJnXXaT1FXa-2880-480.png","dataId":"img1234567"}

业务参数的请求示例:

{
    "service": "baselineCheck",
    "serviceParameters": 
    {
        "imageUrl": "https://img.alicdn.com/tfs/TB1U4r9AeH2gK0jSZJnXXaT1FXa-2880-480.png",
        "dataId": "img1234567"
    }
}

返回参数

名称

类型

描述

示例值

object

Body 返回值。

RequestId

string

本次调用请求的 ID,是由阿里云为该请求生成的唯一标识符,可用于排查和定位问题。

6CF2815C-C8C7-4A01-B52E-FF6E24F53492

Code

integer

返回码。返回 200 代表成功。

200

Msg

string

本次请求的响应消息。

OK

Data

object

图片内容检测后的结果。

DataId

string

检测对象对应的数据 ID。

说明

如果在检测请求参数中传入了 dataId,则此处返回对应的 dataId。

fb5ffab1-993b-449f-b8d6-b97d5e3331f2

Result

array<object>

图片检测的风险标签、置信分等参数结果,数组结构。

object

数据结构。

Label

string

图片内容检测运算后返回的标签。同一张图片可能会检出多个标签和分值。

violent_explosion

Confidence

number

置信分值,0 到 100 分,保留到小数点后 2 位。部分标签无置信分。

81.22

Description

string

描述。

未检测出风险

RiskLevel

string

风险等级。

high

Ext

object

图片辅助参考信息。

Recognition

array<object>

图片万物识别结果。

object

Classification

string

图片万物识别的类别。

办公大楼

Confidence

number

置信分值,0 到 100 分,保留到小数点后 2 位。返回 nonLabel 时无置信分。

81.22

OcrResult

array<object>

图文 OCR 识别结果。

array<object>

Text

string

识别出来的单条文本信息。

abcd

Location

object

文字行及坐标信息。

X

integer

以图片左上角为坐标原点,文字区域左上角到 y 轴的距离,单位:像素。

11

Y

integer

以图片左上角为坐标原点,文字区域左上角到 x 轴的距离,单位:像素。

22

W

integer

文字区域的宽度,单位:像素。

33

H

integer

文字区域的高度,单位:像素。

44

TextInImage

object

返回命中的图片中文字信息。

OcrResult

array<object>

返回识别到的图片中的每行文字信息。

array<object>

Text

string

文字信息。

abcd

Location

object

文字行及坐标信息。

X

integer

以图片左上角为坐标原点,文字区域左上角到 y 轴的距离,单位:像素。

11

Y

integer

以图片左上角为坐标原点,文字区域左上角到 x 轴的距离,单位:像素。

22

H

integer

文字区域的高度,单位:像素。

33

W

integer

文字区域的宽度,单位:像素。

44

RiskWord

array

命中风险关键词

string

文字信息。

abcd

CustomText

array<object>

当命中自定义文本库时,返回自定义库 ID、自定义库名称和自定义词。

object

LibId

string

自定义库 ID

123456

LibName

string

自定义库名称。

自定义库1

KeyWords

string

自定义词,多个词用逗号分隔。

自定义词1,自定义词2

CustomImage

array<object>

自定义图库命中信息列表。

object

LibId

string

命中的自定义图库 ID。

图库123

ImageId

string

命中的自定义图片 ID。

123456

LibName

string

命中的自定义图库名。

图库123

PublicFigure

array<object>

人物信息列表。

array<object>

FigureName

string

识别出的人物名称信息。

yzazhzou

FigureId

string

识别出的人物编码信息。

xxx001

Location

array<object>

标识的位置信息。

object

X

integer

以图片左上角为坐标原点,识别区域左上角到 y 轴的距离,单位:像素。

11

Y

integer

以图片左上角为坐标原点,识别区域左上角到 x 轴的距离,单位:像素。

22

W

integer

识别区域的宽度,单位:像素。

330

H

integer

识别区域的高度,单位:像素。

440

LogoData

array<object>

标识信息。

array<object>

Location

object

标识的位置信息。

X

integer

以图片左上角为坐标原点,识别区域左上角到 y 轴的距离,单位:像素。

11

Y

integer

以图片左上角为坐标原点,识别区域左上角到 x 轴的距离,单位:像素。

22

W

integer

识别区域的宽度,单位:像素。

330

H

integer

识别区域的高度,单位:像素。

440

object

Label

string

标识类别。

logo_sns

Name

string

标识名。

钉钉

Confidence

number

置信分值,0 到 100 分,保留到小数点后 2 位。

99.1

FaceData

array<object>

人脸属性检测结果。

array<object>

Age

integer

年龄识别结果。

18

Bang

object

是否有刘海的识别结果。

Value

string

是否有刘海的识别结果,取值:

  • Has:有刘海。

  • None:无刘海。

Has

Confidence

number

刘海识别结果的置信度,取值范围:0~100。取值越高表示结果越可信。

81.88

Gender

object

性别识别结果。

Value

string

性别识别结果,取值:

  • Male:男性。

  • FeMale:女性。

FeMale

Confidence

number

性别识别结果的置信度,取值范围:0~100。取值越高表示结果越可信。

81.88

Glasses

string

是否佩戴眼镜的识别结果,取值:

  • None:未佩戴眼镜。

  • Common:佩戴普通眼镜。

  • Sunglass:佩戴太阳镜。

Common

Hairstyle

object

发型识别结果。

Value

string

发型识别结果,取值:

  • Bald:光头。

  • Long:长发。

  • Short:短发。

Short

Confidence

number

发型识别结果的置信度,取值范围:0~100。取值越高表示结果越可信。

81.88

Hat

object

是否佩戴帽子的识别结果。

Value

string

是否佩戴帽子的识别结果,取值:

  • Wear:佩戴帽子。

  • None:未佩戴帽子。

Wear

Confidence

number

佩戴帽子结果的置信度,取值范围:0~100。取值越高表示结果越可信。

88.88

Location

object

人脸位置信息。

X

integer

以图片左上角为坐标原点,人脸区域左上角到 y 轴的距离,单位:像素。

41

Y

integer

以图片左上角为坐标原点,人脸区域左上角到 x 轴的距离,单位:像素。

84

W

integer

人脸区域的宽度,单位:像素。

83

H

integer

人脸区域的高度,单位:像素。

26

Mask

object

是否佩戴口罩的识别结果。

Value

string

是否佩戴口罩的识别结果,取值:

  • Wear:佩戴口罩。

  • None:未佩戴口罩。

Wear

Confidence

number

佩戴口罩结果的置信度,取值范围:0~100。取值越高表示结果越可信。

99.99

Mustache

object

是否有胡须的识别结果。

Value

string

是否有胡须的识别结果,取值:

  • Has:有胡须。

  • None:无胡须。

Has

Confidence

number

胡须识别结果的置信度,取值范围:0~100。取值越高表示结果越可信。

99.99

Quality

object

人脸图片的质量信息。

Blur

number

人脸图片的模糊度,取值范围:0~100。分数越高表示越模糊。

建议取值范围:0~25。

5.88

Integrity

number

人脸的完整度,取值范围:0~100。分数越高表示越完整。

建议取值范围:80~100。

100.0

Pitch

number

人脸的抬头或低头角度。

建议取值范围:-30~30。

5.88

Roll

number

人脸的平面旋转角度。

建议取值范围:-30~30。

5.18

Yaw

number

人脸的左右摇头角度。

建议取值范围:-30~30。

5.18

Smile

number

人脸的微笑程度。取值范围:0~100。分数越高表示微笑程度越大。

85.88

VlContent

object

输出内容。

OutputText

string

输出内容。

这是一段描述

AigcData

object

返回图片中的 AIGC 隐式标识检测信息。

AIGC

object

AIGC 隐式标识检测信息。

Label

string

表示内容是否由 AI 生成,取值:

  • 1:属于人工智能内容生成合成的。

  • 2:(仅传播平台)可能为人工智能生成合成内容的。

  • 3:(仅传播平台)疑似人工智能内容生成合成的。

1

ContentProducer

string

服务提供者的编码或名称,用于标识内容的生产者。

001191******M000100Y43

ProduceID

string

内容制作编号,用于制作平台溯源合成内容的唯一识别编号。

123******456

ReservedCode1

string

预留字段。

可存储用于生成合成服务提供者自主开展安全防护,保护内容、标识完整性的信息,可通过基于 ContentProducer 与 ProduceID 的哈希机制,实现关键信息的安全存储与校验。

d41d**********427e

ContentPropagator

string

传播平台名称,编号或代码,针对提供人工智能生成合成内容服务,可保持与 ContentProducer 一致。

001191******M000100Y43

PropagateID

string

内容传播编号,是传播平台对所传播生成合成内容的唯一编号。

123******456

ReservedCode2

string

预留字段。

可用于内容传播服务提供者企业自主开展安全防护,保护内容、标识完整性的信息,可通过基于 ContentProducer 与 ProduceID 的哈希机制,实现关键信息的安全存储与校验。

d41d**********427e

RiskLevel

string

风险等级。

high

ManualTaskId

string

人审任务 ID

xxxxx-xxxxx

AccountId

string

客户入参 AccountId

testaccountid123

返回参数示例

{
    "Msg": "OK",
    "Code": 200,
    "Data": {
        "DataId": "img123****",
        "Result": [
            {
                "Label": "pornographic_adultContent",
                "Confidence": 81,
                "Description": "成人色情"
            },
            {
                "Label": "sexual_partialNudity",
                "Confidence": 98,
                "Description": "肢体裸露或性感"
            },
            {
                "Label": "violent_explosion",
                "Confidence": 70,
                "Description": "烟火类内容"
            },
            {
                "Label": "violent_explosion_lib",
                "Confidence": 81,
                "Description": "烟火类内容_命中自定义库"
            }
        ],
        "RiskLevel": "high"
    },
    "RequestId": "ABCD1234-1234-1234-1234-1234XYZ"
}

示例

正常返回示例

JSON格式

{
  "RequestId": "6CF2815C-C8C7-4A01-B52E-FF6E24F53492",
  "Code": 200,
  "Msg": "OK",
  "Data": {
    "DataId": "fb5ffab1-993b-449f-b8d6-b97d5e3331f2",
    "Result": [
      {
        "Label": "violent_explosion",
        "Confidence": 81.22,
        "Description": "未检测出风险",
        "RiskLevel": "high"
      }
    ],
    "Ext": {
      "Recognition": [
        {
          "Classification": "办公大楼\n",
          "Confidence": 81.22
        }
      ],
      "OcrResult": [
        {
          "Text": "abcd",
          "Location": {
            "X": 11,
            "Y": 22,
            "W": 33,
            "H": 44
          }
        }
      ],
      "TextInImage": {
        "OcrResult": [
          {
            "Text": "abcd",
            "Location": {
              "X": 11,
              "Y": 22,
              "H": 33,
              "W": 44
            }
          }
        ],
        "RiskWord": [
          "abcd"
        ],
        "CustomText": [
          {
            "LibId": "123456\n",
            "LibName": "自定义库1\n",
            "KeyWords": "自定义词1,自定义词2\n"
          }
        ]
      },
      "CustomImage": [
        {
          "LibId": "图库123\n",
          "ImageId": "123456",
          "LibName": "图库123\n"
        }
      ],
      "PublicFigure": [
        {
          "FigureName": "yzazhzou",
          "FigureId": "xxx001",
          "Location": [
            {
              "X": 11,
              "Y": 22,
              "W": 330,
              "H": 440
            }
          ]
        }
      ],
      "LogoData": [
        {
          "Location": {
            "X": 11,
            "Y": 22,
            "W": 330,
            "H": 440
          },
          "Logo": [
            {
              "Label": "logo_sns",
              "Name": "钉钉",
              "Confidence": 99.1
            }
          ]
        }
      ],
      "FaceData": [
        {
          "Age": 18,
          "Bang": {
            "Value": "Has",
            "Confidence": 81.88
          },
          "Gender": {
            "Value": "FeMale",
            "Confidence": 81.88
          },
          "Glasses": "Common",
          "Hairstyle": {
            "Value": "Short",
            "Confidence": 81.88
          },
          "Hat": {
            "Value": "Wear",
            "Confidence": 88.88
          },
          "Location": {
            "X": 41,
            "Y": 84,
            "W": 83,
            "H": 26
          },
          "Mask": {
            "Value": "Wear",
            "Confidence": 99.99
          },
          "Mustache": {
            "Value": "Has",
            "Confidence": 99.99
          },
          "Quality": {
            "Blur": 5.88,
            "Integrity": 100,
            "Pitch": 5.88,
            "Roll": 5.18,
            "Yaw": 5.18
          },
          "Smile": 85.88
        }
      ],
      "VlContent": {
        "OutputText": "这是一段描述"
      },
      "AigcData": {
        "AIGC": {
          "Label": "1",
          "ContentProducer": "001191******M000100Y43",
          "ProduceID": "123******456\n\n",
          "ReservedCode1": "d41d**********427e\n",
          "ContentPropagator": "001191******M000100Y43",
          "PropagateID": "123******456\n",
          "ReservedCode2": "d41d**********427e"
        }
      }
    },
    "RiskLevel": "high",
    "ManualTaskId": "xxxxx-xxxxx",
    "AccountId": "testaccountid123"
  }
}

错误码

访问错误中心查看更多错误码。

变更历史

更多信息,参考变更详情