基于大模型的图片审核增强版服务(公测)

阿里云内容安全图片审核增强版推出基于通义定制审核大模型的图片检测服务,能够全方位识别图片中的色情、性感、涉政、暴恐、违禁、宗教、引流广告、不良等违规内容。本文介绍如何使用图片审核大模型服务。

重要

阿里云内容安全图片审核大模型服务当前处于公测阶段,服务在快速升级和迭代过程中,如果您有任何测试反馈和建议,请联系您的商务经理进行反馈。

一、使用场景

阿里云基于图片场景内容风险的特性,定制训练通义审核大模型,应用于内容安全图片审核产品中,推出以下图片审核大模型服务:

  • 应用大模型的图片风险检测综合应用图片审核大模型和专家模型能力,能够全方位识别图片中的色情、性感、涉政、暴恐、违禁、宗教、引流广告、不良等违规内容。基于大小模型融合,能够提供更好效果的图片审核检测服务,相对于基于大模型的通用基线检测,综合识别能力更强,标签更丰富。

  • 基于大模型的通用基线检测基于图片审核场景定制训练的审核大模型,能够识别图片中的涉黄、涉政、暴恐、违禁、不良、辱骂、广告等风险。主要使用大模型的图片审核服务,可以检测部分小模型识别较难的case,主要体现大模型的识别能力。

二、服务说明

图片审核增强版大模型审核支持的服务(Service)如下:

服务(Service)

检测内容

适用场景

服务名称:应用大模型的图片风险检测

Service:postImageCheckByVL

综合应用图片审核大模型和专家模型能力,能够全方位识别图片中的色情、性感、涉政、暴恐、违禁、宗教、引流广告、不良等违规内容,可返回详细标签。详细可检测项,请参见内容安全控制台

说明

当前仅上海区域支持,调用时接入地域请选择上海,其他区域正在逐步开放中。

针对图片审核场景,保障最好的效果为优先。建议需要保障效果优先的时候选择该服务。

服务名称:基于大模型的通用基线检测

Service:baselineCheckByVL

基于图片审核场景定制训练的审核大模型,能够识别图片中的涉黄、涉政、暴恐、违禁、不良、辱骂、广告等风险,可返回大类标签。详细可检测项,请参见内容安全控制台

说明

当前仅上海、北京区域支持,调用时接入地域请选择上海或者北京,其他区域正在逐步开放中。

主要应用图片审核大模型的检测服务。需要体验大模型审核能力时,建议选择该服务。

三、计费说明

图片审核增强版图片审核大模型服务支持按量后付费和资源包抵扣两种付费方式。

按量后付费

当您开通图片审核增强版服务后,默认付费方式是按量后付费,且按照实际用量结算当日费用,不调用服务不收费。

审核类型

支持的业务场景(服务)

计费单价

图片审核大模型版(image_vl_standard

  • 应用大模型的图片风险检测postImageCheckByVL

  • 基于大模型的通用基线检测baselineCheckByVL

45元/万次

说明

调用1次左侧任一服务进行1次计费。根据实际调用量计费,如调用100应用大模型的图片风险检测服务计费0.45元。

说明

内容安全增强版的按量付费的计量出账频率为1小时/次。在出账详单中,moderationType对应上述审核类型字段。您可以查看账单详情

资源包抵扣

如果您的审核量较大,或有相对固定的审核需求,建议预先购买资源包的方式。购买资源包规格越大,享受的折扣越大,支持叠加购买和使用。更多内容,请参见购买内容审核增强版抵扣资源包

该资源包用于内容审核增强版用量的抵扣,无法与内容安全1.0版流量包共享,具体的抵扣系数如下:

审核类型

支持的业务场景(服务)

抵扣系数

图片审核大模型版(image_vl_standard

  • 应用大模型的图片风险检测postImageCheckByVL

  • 基于大模型的通用基线检测baselineCheckByVL

抵扣系数为6,表示每成功调用一次接口,抵扣资源包的流量包容量规格6次。

例如购买的资源包的流量包容量规格为10次,当您成功调用1次接口,抵扣流量包容量规格6次,剩余4次。

购买后,使用图片审核增强版API所产生的用量会优先抵扣资源包的次数,当资源包次数不足以抵扣时,阿里云费用系统会自动按照按量付费进行出账,请及时关注您的资源包余量和按量付费账单。您可以通过阿里云费用中心的资源包系统设定余量预警通知。

四、接入指南

步骤一:开通服务

访问开通服务,开通图片核增强版服务。

开通图片增强版服务后,默认付费方式是按量后付费,且按照实际用量结算当日费用,不调用服务不收费。接口接入使用后系统会按使用量自动出账,具体信息,请参见计费说明您也可以购买按量抵扣资源包,资源包相较于后付费存在一定阶梯折扣,适合使用量级可预期和较大的用户。

步骤二:为RAM用户授权

在接入SDK或者API之前,您需要为RAM用户授权。您可以为阿里云账号和RAM用户创建一个访问密钥(AccessKey)。在调用阿里云API时您需要使用AccessKey完成身份验证。获取方式,请参见获取AccessKey

  1. 使用阿里云账号(主账号)或RAM管理员登录RAM控制台

  2. 创建RAM用户。具体操作,请参见创建RAM用户

  3. RAM用户授权系统策略权限:AliyunYundunGreenWebFullAccess。具体操作,请参见RAM用户授权。完成以上配置后,您可以使用RAM用户调用内容安全API。

步骤三:安装并接入SDK

请参考图片审核增强版SDK及接入指南,目前支持的接入地域如下:

地域

外网接入地址

内网接入地址

支持服务

华东2(上海)

green-cip.cn-shanghai.aliyuncs.com

green-cip-vpc.cn-shanghai.aliyuncs.com

postImageCheckByVL、baselineCheckByVL

华北2(北京)

green-cip.cn-beijing.aliyuncs.com

green-cip-vpc.cn-beijing.aliyuncs.com

baselineCheckByVL

步骤四:调整图片审核的规则(可选)

您可以在内容安全控制台调整图片审核大模型的检测规则,包括检测范围开关、复制service、配置自定义图库、配置自定义词库、查询检测记录、查询用量等。具体操作,请参见控制台操作指南

五、API接口

使用说明

您可以调用该接口创建图片内容检测任务。关于如何构造HTTP请求,请参见接入指南;您也可以直接选用已构造好的HTTP请求,更多信息,请参见接入指南

  • 业务接口:ImageModeration

  • 计费信息:该接口为收费接口。仅对HTTP状态码为200的请求进行计量计费,产生其他错误码时不会计费。关于计费方式,请参见计费说明

  • 图片要求

    • 图片支持以下格式:PNG、JPG、JPEG、BMP、WEBP、TIFF、SVG、HEIC(该格式最长边需小于8192 px)、GIF(取第一帧)、ICO(取最后一图)。

    • 图片大小限制在20 MB以内,高或者宽不能超过16384 px,且总像素不能超过2.5亿 px。像素建议大于200*200(px),像素过低会影响内容安全检测算法的效果。

    • 图片下载时间限制为3秒内,如果下载时间超过3秒,返回下载超时。

QPS限制

本接口的单用户QPS限制为5次/秒。超过限制,API调用会被限流,这可能会影响您的业务,请合理调用。如果您业务量级较大或者有紧急扩容需求需要更大QPS,请联系您的商务经理。

调试

在接入前,您也可以通过阿里云OpenAPI在线调试图片审核增强版的接口,查看调用示例代码及SDK依赖信息,方便概览接口的使用方法和参数。

重要

在线调试能力是基于当前登录账号调用内容安全的API接口,因此调用量会计入账号的收费用量中。

请求参数

关于在请求中必须包含的公共请求参数,请参考接入指南

请求body是一个JSON结构体,包含以下字段:

名称

类型

是否必选

示例值

描述

Service

String

postImageCheckByVL

检测服务。取值:

  • postImageCheckByVL应用大模型的图片风险检测

  • baselineCheckByVL基于大模型的通用基线检测

ServiceParameters

JSONString

内容检测对象的相关参数集。JSON字符串格式,关于每个字符串的描述,请参见ServiceParameters

表 1.ServiceParameters

名称

类型

是否必选

示例值

描述

imageUrl

String

是。图片审核增强版支持三种方式传入图片,请您选择其中一种:

  • 使用图片URL方式进行检测,传入imageUrl。

  • 使用OSS授权进行检测,必须同时传入ossBucketName、ossObjectName、ossRegionId。

  • 使用本地图片进行检测。上传本地图片检测,不占用您的OSS存储空间,且文件只存储30分钟。SDK接入已经集成本地图片上传功能,具体代码示例,请参见图片审核增强版SDK及接入指南

https://img.alicdn.com/tfs/TB1U4r9AeH2gK0jSZJnXXaT1FXa-2880-480.png

待检测对象的URL,请确保该URL能通过公网访问到,且URL地址长度不超过2048个字符。

说明 URL地址中不能包含中文,且一次请求请确保仅传入1URL。

ossBucketName

String

bucket_01

已授权OSS空间的Bucket名。

说明

使用OSS图片内网地址时必须先使用阿里云账号(即主账号)访问云资源访问授权页面进行授权。

ossObjectName

String

2022023/04/24/test.jpg

已授权OSS空间的文件名。

ossRegionId

String

cn-beijing

OSS Bucket所在区域。

dataId

String

img123****

检测对象对应的数据ID。

由大小写英文字母、数字、下划线(_)、短划线(-)、英文句号(.)组成,不超过64个字符,可以用于唯一标识您的业务数据。

referer

String

www.aliyun.com

referer请求头,用于防盗链等场景。长度不超过256个字符。

返回数据

名称

类型

示例值

描述

RequestId

String

70ED13B0-BC22-576D-9CCF-1CC12FEAC477

本次调用请求的ID,是由阿里云为该请求生成的唯一标识符,可用于排查和定位问题。

Data

Object

图片内容检测结果。更多信息,请参见Data

Code

Integer

200

状态码。更多信息,请参见Code说明

Msg

String

OK

本次请求的响应消息。

表 2.Data

名称

类型

示例值

描述

Result

Array

图片检测的风险标签、置信分等参数结果。更多信息,请参见result

RiskLevel

String

high

风险等级,根据设置的高低风险分返回,返回值包括:

  • high:高风险

  • medium:中风险

  • low:低风险

  • none:未检测到风险

说明

高风险内容建议直接处置;中风险内容建议人工复查;低风险内容建议在高召回需求时再做处理,日常建议和未检测到风险做相同处理。风险分值可以在内容安全控制台配置。

DataId

String

img123******

检测对象对应的数据ID。

说明

如果在检测请求参数中传入了dataId,则此处返回对应的dataId。

表 3.result

名称

类型

示例值

描述

Label

String

tm_auto

图片内容检测运算后返回的标签。同一张图片可能会检出多个标签和分值。支持的标签,请参见:

Confidence

Float

81.22

置信分值,0100分,保留到小数点后2位。部分标签无置信分,更多信息,请参见风险标签释义表

Description

String

烟火类内容

Labal字段的说明。

重要

该字段为Label字段的解释说明,可能会变更调整,实际处理结果时建议处理Label字段,不要基于该字段进行结果处置。

示例

请求示例

{
    "Service": "postImageCheckByVL",
    "ServiceParameters": {
        "imageUrl": "https://img.alicdn.com/tfs/TB1U4r9AeH2gK0jSZJnXXaT1FXa-2880-480.png",
        "dataId": "img0307****"
    }
}

返回示例

  • 系统检测到风险内容时,返回示例:

{
    "Msg": "OK",
    "Code": 200,
    "Data": {
        "DataId": "img0307****",
        "Result": [
            {
                "Label": "violent_crowding",
                "Confidence": 81.88,
                "Description": "人群聚集"
            },
            {
                "Label": "violent_explosion",
                "Confidence": 74.66,
                "Description": "烟火类内容"
            }
        ],
        "RiskLevel": "high"
    },
    "RequestId": "ABCD1234-1234-1234-1234-1234XYZ"
}
  • 当系统没有检测到风险内容时,返回示例:

{
    "Msg": "OK",
    "Code": 200,
    "Data": {
        "DataId": "img123****",
        "Result": [
            {
                "Label": "nonLabel",
                "Description": "未检测出风险"
            }
        ],
        "RiskLevel": "none"
    },
    "RequestId": "ABCD1234-1234-1234-1234-1234XYZ"
}
  • 系统检测到您传入的图片命中了您配置的免审图库时,返回示例:

{
    "Msg": "OK",
    "Code": 200,
    "Data": {
        "DataId": "img123****",
        "Result": [
            {
                "Label": "nonLabel_lib",
                "Confidence": 87.28,
                "Description": "命中免审图库"
            }
        ],
        "RiskLevel": "none"
    },
    "RequestId": "ABCD1234-1234-1234-1234-1234XYZ"
}
说明

文档中的请求示例和返回示例为了便于阅读,做了格式化处理,实际返回结果是没有进行换行、缩进等处理。

风险标签释义表

以下是风险标签值、对应的分值区间以及对应的含义。每个风险标签均可以在控制台进行开关配置,部分风险标签会提供更细分检测范围的开关配置。具体操作,请参见控制台操作指南AIGC图片检测服务支持标签如下:

说明

建议您将系统返回的风险标签和置信分做一定周期的数据存储,以便于在后续内容治理时参考,可根据风险标签设定人工审核或标注的优先级、分层分类的内容治理措施。

表 4.应用大模型的图片风险检测postImageCheckByVL)支持标签

标签值(label)

置信分区间(confidence)

中文含义

pornographic_adultContent

0~100分,分数越高置信度越高

疑似含有成人色情内容。

pornographic_adultToys

0~100分,分数越高置信度越高

画面中疑似含有成人器具内容。

pornographic_artwork

0~100分,分数越高置信度越高

画面中疑似含有艺术品色情内容。

pornographic_adultContent_tii

0~100分,分数越高置信度越高

图片中文字疑似色情内容。

sexual_suggestiveContent

0~100分,分数越高置信度越高

画面疑似低俗或性暗示内容。

sexual_breastBump

0~100分,分数越高置信度越高

画面疑似含有凸点轮廓内容。

sexual_cleavage

0~100分,分数越高置信度越高

画面疑似含有女性乳沟特征。

sexual_femaleUnderwear

0~100分,分数越高置信度越高

画面疑似含有内衣泳衣内容。

sexual_maleTopless

0~100分,分数越高置信度越高

画面疑似含有男性赤膊内容。

sexual_femaleShoulder

0~100分,分数越高置信度越高

画面疑似含有肩部性感内容。

sexual_femaleLeg

0~100分,分数越高置信度越高

画面疑似含有腿部性感内容。

sexual_pregnancy

0~100分,分数越高置信度越高

画面疑似含有孕照哺乳内容。

sexual_cartoon

0~100分,分数越高置信度越高

画面疑似含有卡通性感内容

sexual_underage

0~100分,分数越高置信度越高

画面疑似含有儿童性感内容。

political_historicalNihility

0~100分,分数越高置信度越高

画面疑似涉及虚无历史或不宜传播的历史事件。

political_historicalNihility_tii

0~100分,分数越高置信度越高

图中文字疑似历史虚无。

political_politicalFigure_1

0~100分,分数越高置信度越高

画面疑似含现任历任领导人。

political_politicalFigure_2

0~100分,分数越高置信度越高

画面疑似涉及领导人家属。

political_politicalFigure_3

0~100分,分数越高置信度越高

画面疑似涉及省、市政府人员。

political_politicalFigure_4

0~100分,分数越高置信度越高

画面疑似涉及国外领导人及家属。

political_politicalFigure_name_tii

0~100分,分数越高置信度越高

图中文字含领导人姓名。

political_politicalFigure_metaphor_tii

0~100分,分数越高置信度越高

图中文字疑似含有对主要领导人的代称、暗喻。

political_prohibitedPerson_tii

0~100分,分数越高置信度越高

图中文字疑似含落马官员的姓名。

political_prohibitedPerson_1

0~100分,分数越高置信度越高

画面疑似含有国家级落马官员。

political_prohibitedPerson_2

0~100分,分数越高置信度越高

画面疑似含有省市级落马官员。

political_taintedCelebrity

0~100分,分数越高置信度越高

画面疑似包含劣迹或重大负面的公众人物。

political_taintedCelebrity_tii

0~100分,分数越高置信度越高

图中文字疑似有劣迹艺人的姓名。

political_Chinaflag

0~100分,分数越高置信度越高

画面疑似含有中国国旗。

political_otherflag

0~100分,分数越高置信度越高

画面疑似含有其他国家国旗。

political_Chinamap

0~100分,分数越高置信度越高

画面疑似含有中国地图。

political_logo

0~100分,分数越高置信度越高

画面疑似含有禁宣媒体标识。

political_outfit

0~100分,分数越高置信度越高

画面疑似含有军警服装、作战部队服装。

political_medicalOutfit

0~100分,分数越高置信度越高

画面疑似含有医护服饰。

political_badge

0~100分,分数越高置信度越高

画面疑似含有国徽、党徽。

political_racism_tii

0~100分,分数越高置信度越高

图中文字疑似含有特殊的表达。更多信息,请参见内容安全控制台

violent_crowding

0~100分,分数越高置信度越高

画面疑似有人群聚集。

violent_explosion

0~100分,分数越高置信度越高

画面疑似含有烟火类内容元素。

violent_armedForces

0~100分,分数越高置信度越高

画面疑似包含暴恐组织。

violent_gun

0~100分,分数越高置信度越高

画面疑似包含枪支。

violent_Knives

0~100分,分数越高置信度越高

画面疑似包含刀具。

violent_gunKnives_tii

0~100分,分数越高置信度越高

图中文字含枪支刀具的描述。

violent_blood

0~100分,分数越高置信度越高

画面疑似含有血腥内容。

violent_horrific

0~100分,分数越高置信度越高

画面疑似包含惊悚内容。

violent_horrific_tii

0~100分,分数越高置信度越高

图中文字疑似描述暴力、恐怖的内容。

violent_burning

0~100分,分数越高置信度越高

画面疑似含有燃烧类内容元素。

contraband_drug

0~100分,分数越高置信度越高

画面疑似毒品、药品。

contraband_drug_tii

0~100分,分数越高置信度越高

图中文字疑似描述违禁毒品。

contraband_gamble

0~100分,分数越高置信度越高

画面疑似赌博物品。

contraband_gamble_tii

0~100分,分数越高置信度越高

图中文字疑似描述赌博行为。

contraband_certificate_tii

0~100分,分数越高置信度越高

图中文字疑似含办证套现类广告引流。

contraband

0~100分,分数越高置信度越高

疑似含有违禁内容

religion_funeral

0~100分,分数越高置信度越高

画面疑似含有葬礼灵堂内容。

religion_buddhism

0~100分,分数越高置信度越高

疑似含有特定服饰或标识。更多信息,请参见内容安全控制台

religion_christianity

0~100分,分数越高置信度越高

religion_muslim

0~100分,分数越高置信度越高

religion_tii

0~100分,分数越高置信度越高

racism_tii

0~100分,分数越高置信度越高

PDA_kiss

0~100分,分数越高置信度越高

画面疑似包含亲吻内容。

PDA_physicalContact

0~100分,分数越高置信度越高

画面疑似包含亲密行为。

object_landmark

0~100分,分数越高置信度越高

画面疑似包含国内地标内容。

object_rmb

0~100分,分数越高置信度越高

画面疑似包含人民币、硬币。

object_foreignCurrency

0~100分,分数越高置信度越高

画面疑似包含外国货币。

object_wn

0~100分,分数越高置信度越高

画面疑似包含特定形象。

object_carcrash

0~100分,分数越高置信度越高

画面疑似包含车祸内容。

object_candle

0~100分,分数越高置信度越高

画面疑似包含蜡烛内容。

object_flood

0~100分,分数越高置信度越高

画面疑似包含自然灾害内容。

object_pii

0~100分,分数越高置信度越高

画面疑似含个人证件内容

pt_logotoSocialNetwork

0~100分,分数越高置信度越高

画面中含有常见网络社交平台水印。

pt_qrCode

0~100分,分数越高置信度越高

图中包含二维码。

pt_programCode

0~100分,分数越高置信度越高

图中包含小程序码。

pt_toDirectContact_tii

0~100分,分数越高置信度越高

图中文字疑似含有特定引流信息。更多信息,请参见内容安全控制台

pt_toSocialNetwork_tii

0~100分,分数越高置信度越高

pt_toShortVideos_tii

0~100分,分数越高置信度越高

pt_investment_tii

0~100分,分数越高置信度越高

pt_recruitment_tii

0~100分,分数越高置信度越高

inappropriate_smoking

0~100分,分数越高置信度越高

画面疑似包含烟相关内容。

inappropriate_drinking

0~100分,分数越高置信度越高

画面疑似包含酒相关内容。

inappropriate_tattoo

0~100分,分数越高置信度越高

画面疑似包含纹身内容。

inappropriate_middleFinger

0~100分,分数越高置信度越高

画面疑似包含竖中指内容。

inappropriate_foodWasting

0~100分,分数越高置信度越高

画面疑似包含浪费粮食内容。

logo_brand

0~100分,分数越高置信度越高

画面疑似包含商标内容。

logo_tv

0~100分,分数越高置信度越高

画面疑似含有电视台标类标识。

logo_streaming

0~100分,分数越高置信度越高

画面疑似含有影音娱乐类标识。

profanity_oral_tii

0~100分,分数越高置信度越高

图中文字含不文明低俗口头语

profanity_offensive_tii

0~100分,分数越高置信度越高

图中文字含严重辱骂内容

meme_vulgar

0~100分,分数越高置信度越高

画面疑似含低俗表情包

meme_metaphor

0~100分,分数越高置信度越高

画面疑似含隐喻表情包

表 5.基于大模型的通用基线检测baselineCheckByVL)支持标签

标签值(label)

置信分区间(confidence)

中文含义

politics

0~100分,分数越高置信度越高

疑似含有涉政内容

pornographic

0~100分,分数越高置信度越高

疑似含有涉黄的内容

sexualHint

0~100分,分数越高置信度越高

疑似含有性暗示内容

profanity

0~100分,分数越高置信度越高

疑似含有辱骂的内容

terror

0~100分,分数越高置信度越高

疑似含有暴恐内容。

ad

0~100分,分数越高置信度越高

疑似含有广告内容。

contraband

0~100分,分数越高置信度越高

疑似含有违禁内容。

inappropriate

0~100分,分数越高置信度越高

疑似含有不良内容。

此外,上述每个风险标签也支持配置自定义图库实现,如检测的图片与自定义图库中的图片相似度高,则系统会返回对应的风险标签。为了便于区分,标签值(label)格式为原风险标签值_lib。例如,您对“violent_explosion”配置了自定义图库,当检测的图片匹配到自定义图库中的任意一张图片且相似度较高,系统会在label参数中返回violent_explosion_lib,对应的 confidence参数会以分值的形式代表相似程度。

当系统对传入的图片检测未发现异常,或着与您配置的免审图片中任意一张相似度高,则系统返回的标签值和置信分满足如下表格。

标签值(label)

置信分区间(confidence)

中文含义

nonLabel

无该字段

该图片未检测出风险,或者您已全关闭检测项。更多信息,请参见内容安全控制台

nonLabel_lib

0~100分,分数越高置信度越高

该图片与您选配的免审图片中存在较高相似度。更多信息,请参见内容安全控制台

Code说明

以下为接口返回code的含义说明,系统仅对code返回为200的请求计量计费,其他code不会计费。

Code

说明

200

请求正常。

400

请求参数为空。

401

请求参数错误。

402

请求参数长度不符合接口规定,请检查并修改。

403

请求超过QPS限制,请检查并调整并发。

404

传入的图片下载遇到错误,请检查或重试。

405

传入的图片下载超时,可能是因为图片无法访问,请检查调整后重试。

406

传入的图片过大,请检查调整图片大小后再重试。

407

传入的图片格式暂不支持,请检查调整后重试。

408

该账号无权限调用该接口,可能是账号未开通或者已欠费,或者调用账号未被授权访问。

500

系统异常。