内容安全检测

如果您希望检测OSS存储的图片是否包含违规内容,例如图片内容是否涉黄、涉政、涉恐、涉暴等,您可以选择OSS提供的内容安全检测服务。OSS内容安全服务具有通用性强、易用性高、价格实惠的特点。通过OSS内容安全检测服务可以帮助您提高图片内容审核效率,及时发现并处理违规图片,提升内容安全和用户体验。

背景信息

内容安全检测功能基于阿里安全团队的AI算法和领域知识库,并保持日常迭代和运营升级。相较于人工审核和标注,该功能具有更高的内容分析时效、更大的任务并发量、更低的费用成本,满足UGC、AIGC等海量内容管理的场景。

OSS内容安全检测支持90+内容风险分析和分类,适用于您对Bucket中的图片文件进行扫描,识别是否存在违反网络内容传播相关规定、影响平台内容秩序、影响用户体验的风险内容或元素。

您可以根据业务所处的行业场景规范或平台内容治理规范进行检测规则的调整,也可以基于系统所投递的风险标签和置信分数据,对具体内容制定进一步的审核或治理措施。

检测范围

检测服务

适用场景

检测内容

通用-图片基线检测

检测图片中是否存在违规或不宜传播的内容。建议对涉及开放公网访问的图片均进行该项检测。

支持对图片中的色情、性感、涉政、暴恐、违禁等合规类要求的审核项进行检测。

头像-图片风险检测

检测头像场景的图片中是否含有非法内容、诱导性信息、商标或恶搞元素等风险。建议对用户账号头像、商家店铺头像等图片进行该项检测。

支持对图片中的色情、低俗、涉政、暴恐、广告、辱骂、符号等内容进行检测。

AIGC-图片风险检测

针对AI场景,检测AIGC生成的图片是否存在违规或者不宜传播的内容。建议AI生成的图片均进行该项检测。

针对AIGC生成的图片进行专门优化,支持对色情、低俗、性感、涉政、暴恐、违禁、引人不适、不良等内容进行检测。

前提条件

RAM用户必须拥有oss:ActivateProduct权限。具体操作,请参见RAM用户授权自定义的权限策略

费用说明

  • 对一个Object检测一次,即可同时完成涉黄、涉政、涉恐、涉暴等检测。计费标准为5元/万次,但检测次数取决于图片检测选择的检测服务数量。

    当检测某个Object时,如果只选择了通用-图片基线检测服务,则计算为1次服务检测。如果同时选择了通用-图片基线检测和AIGC-图片风险检测服务,则计算为2次服务检测。

  • 仅支持按量付费。按量付费执行按小时计费的策略(账单出账时间通常在当前计费周期结束后,具体出账时间以系统为准)。

注意事项

OSS内容安全检测功能支持检测Bucket中的图片内容,并对图片内容进行风险分析和标记,但不会对图片内容进行修改或移动。

使用限制

  • 地域限制

    华东1(杭州)、华东2(上海)、华东5(南京-本地地域)、华东6(福州-本地地域)、华中1(武汉-本地地域)、华北1(青岛)、华北2(北京)、华北 3(张家口)、华北5(呼和浩特)、华北6(乌兰察布)、华南1(深圳)、华南2(河源)、华南3(广州)、西南1(成都)地域支持使用内容安全检测。

  • Bucket存储类型限制

    仅标准存储类型的Bucket支持使用内容安全检测。低频访问、归档、冷归档以及深度冷归档类型的Bucket不支持使用内容安全检测。

  • Object存储类型限制

    • 标准存储、低频访问类型的Object支持直接使用内容安全检测。

    • 归档类型Object如果未开启归档直读,需要解冻后才能使用内容安全检测。如果已开启归档直读,可以直接使用内容安全检测。具体操作,请参见归档直读解冻文件

    • 冷归档和深度冷归档Object需要解冻后才能使用内容安全检测。

  • 图片格式限制

    仅支持PNG、JPG、JPEG、BMP、WEBP、TIFF、SVG、ICO以及HEIC。

  • 图片大小限制

    以上格式图片中,除HEIC最长边要求小于8192 px以外,其他格式的图片大小建议在10 MB以内,像素建议大于200*200(px),像素过低会影响内容安全检测算法的效果。

使用OSS控制台

  1. 首次使用内容安全检测时,您需要开通内容安全检测服务,并完成角色授权。

    1. 登录OSS管理控制台

    2. 单击Bucket 列表,然后单击目标Bucket名称。

    3. 在左侧导航栏,选择内容检测 > 内容安全

    4. 内容安全页面的检测任务页签,单击开通,然后按页面指引领取内容安全免费试用额度,超出免费试用额度部分将采用按量付费。

    5. 开通内容安全服务后,在内容安全页面的检测任务页签,单击授权OSS和日志访问,然后按页面指引完成AliyunOSSCIPScanOSSRole角色授权。

      授权完成需要1~2分钟。授权完成后,该角色默认拥有对Bucket内文件进行访问,以及创建用于投递检测结果数据的日志服务LogstoreProject的权限。

  2. 设置检测规则。

    1. 单击内容安全页面的检测规则页签。

    2. 检测规则页签,选择检测服务,然后单击右侧的设置规则。

    3. 规则配置页面,单击编辑,然后根据业务需求对检测项目进行开启或关闭。

    4. 单击保存,约2~3分钟后风险检测规则配置生效。

  3. 创建检测任务。

    1. 选择类型。

      1. 单击内容安全页面的检测任务页签。

      2. 检测任务页签,单击创建批量任务

      3. 创建批量任务对话框,修改任务名称,选择任务类型和检测服务。

        选择任务类型时默认开启智能格式。开启智能格式后,检测任务会根据文件的Content-Type自动识别图片类型的文件。

      4. 单击下一步

    2. (可选)指定范围,然后单击下一步

      默认情况下,将检测Bucket内的所有文件。您可以根据需求对检测内容进行筛选。支持按时间范围筛选,按文件前缀筛选等。

    3. (可选)选择规格,然后单击提交

      默认情况下,不限制Bucket内的文件检测数量,按照异步排队的方式进行检测。您可以根据需求调整文件检测的上限。

      说明

      当异步排队任务不多时,百万级数量的文件检测任务可在24小时内完成,千万级数量的文件检测任务预估在48小时内完成,亿级数量的文件检测任务可能在72小时内完成。

  4. 任务状态进入已完成阶段后,查看检测结果。

    检测结果不超出50,000条数据

    默认最多可查询最近180天的检测结果,最多展示和导出50,000条数据。当检测结果不超出50,000条数据时,建议直接通过OSS控制台进行查看。

    1. 检测任务页签,单击目标任务右侧的查看结果

    2. 查询结果页面,您可以根据检测时间范围、文件名(Object)、文本信息进行筛选和查询。

      Dingtalk_20240115154743.jpg

    检测结果超出50,000条数据

    全部检测结果会自动推送到日志服务中以固定规则命名的Project下专属的Logstore。默认创建的Project格式为aliyun-cip-阿里云账号UID-cn-shanghai,专属Logstoreoss-cip-osscheck-log。如果检测结果超出50,000条数据,您可以通过日志服务进行查看。

    1. 登录日志服务控制台

    2. Project列表区域,单击目标Project。

    3. 日志存储 > 日志库页签中,单击oss-cip-osscheck-log

    4. 查看OSS违规检测结果投递到日志服务的日志。

      1.jpg

      字段详情说明如下:

      字段

      类型

      是否创建索引

      说明

      bucket

      String

      文件所在的OSS存储空间(Bucket)名称。

      code

      Integer

      检测请求错误码。

      contentType

      String

      文件类型。

      jobId

      String

      检测任务ID。

      jobName

      String

      检测任务名称。

      labels

      String

      内容安全检测结果返回标签,多标签之间用英文逗号分隔。

      labels2

      String

      (如有)其他类型检测结果返回标签,多标签之间用英文逗号分隔。

      md5

      String

      文件MD5。

      msg

      String

      检测请求错误信息。

      object

      String

      文件对象(Object)名称。

      parentJobId

      String

      检测父任务ID(用于定时检测任务)。

      regionId

      String

      OSS Bucket所属地域。

      requestId

      String

      检测任务请求ID。

      scanResult

      String

      检测详细结果,格式为JSON字符串。

      serviceCode

      String

      检测配置服务。

      subUid

      String

      阿里云RAM用户UID。

      uid

      String

      阿里云账号UID。

    5. (可选)日志服务采集到OSS内容检测结果的日志后,您可以执行查询分析、下载、投递、加工、创建告警等操作,帮助您了解内容风险趋势并实时监测。更多信息,请参见云产品日志通用操作

    关于不同检测服务对应的标签值说明,请参见风险标签释义表

  5. 对检测结果不为nonLable的图片文件进行处理。

    1. 如果仍然需要保留该图片文件,建议对图片文件添加水印、增加模糊效果等处理。更多信息,请参见图片水印模糊效果

    2. 如果不希望继续保留该图片文件,建议删除。更多信息,请参见删除文件

相关文档

如果您对内容检测范围有更高要求,例如希望对OSS或者本地存储的音频、视频、文本、文档等多种数据类型进行检测,请参见内容安全增强版