文本审核增强版服务通过升级内容安全核心引擎,采用动态策略和模型强化变异对抗性,提供多种业务场景的审核服务,识别出多种违规风险。本文介绍如何使用文本审核增强版。

功能特性

与旧版文本检测服务相比较,文本审核增强版服务支持更多的功能,并支持业务自定义规则,为您提供更全面的内容安全保障。

匹配业务场景

文本审核增强版服务支持匹配多种业务场景,为您简化业务接入和选择模型的工作,扩大合规风险覆盖的范围。您可根据需要的业务场景选择对应的服务。

服务 service常用业务场景场景特性说明
nickname_detection用户昵称、公众号名称、直播间标题等侧重识别底线违规类、仿冒官方、禁限引流风险,可辅助治理虚假账号。
chat_detection用户间聊天互动在平衡用户体验基础上,主要识别底线违规类、辱骂网暴等风险。
comment_detection评论、弹幕、公聊、转发等通常风险率高、风险类型多、变形变异强,识别底线违规类、广告导流、禁限内容等风险。
pgc_detection教学材料、课件内容、课程题目等通常风险率低,精确检测底线类风险。
ai_art_detectionAIGC的文字指令、聊天机器人等兼容中英文本,侧重识别底违规类和负面内容。
ad_compliance_detection商品素材、广告文案识别疑似违反广告法规,包括极限词、行业禁限、红线违规等风险。

增强变异对抗

采用动态策略和模型引擎,强化内容对抗性,能够识别更多内容变形变异情况下的违规风险。检测能力包含但不限于如下所示:

对抗方式原内容变形后旧版文本检测文本审核增强版
简繁体阿里云阿裏雲支持支持
大小写abcdefgAbcdEFG支持支持
特殊字符825394007304ȣᒿƼᗱ୨丩૦ǪךȝᴏЧ部分支持支持
表情符号禁止ts不支持支持
拼音混合阿里云内容风控a里yun内容feng控部分支持支持
同音字阿里云啊鲤云不支持支持
形近字冻、栋、岽部分支持支持
中文拆字辶斤部分支持支持
文字变序阿里云云里阿、阿云里部分支持支持
文字间隔阿里云阿★*里|云部分支持支持

丰富审核标签

支持更丰富的审核标签,以及更详细的原因定位。如果内容存在多类风险,能够同时返回多个标签。标签分类包括但不限于如下所示:

标签类型分类
一级标签(labels)
  • ad:广告
  • political_content:涉政
  • profanity:辱骂
  • contraband:违禁品
  • sexual_content:色情
  • violence:暴恐
  • nonsense:灌水
  • spam:垃圾信息
  • negative_content:不良场景
  • cyberbullying:网络暴力
  • C_customized:用户库命中
细分标签(riskTips)支持一级标签细化为更细粒度的标签,可用于定位具体原因。关于细分标签类型需联系运营人员。

计费说明

文本审核增强版服务支持按量后付费和资源包抵扣两种付费方式。

按量后付费

当您开通文本审核增强版服务后,默认付费方式是按量后付费,且按照实际用量结算当日费用,不调用服务不收费。更多内容,请参见开通内容审核增强版服务

审核类型支持的业务场景(服务)计费单价
文本审核通用(text_standard)
  • 用户昵称:nickname_detection
  • 私聊互动:chat_detection
  • 公聊评论:comment_detection
  • 教学物料PGC:pgc_detection
  • AIGC文字指令:ai_art_detection
  • 广告法合规:ad_compliance_detection
7.5元/万次

资源包抵扣

如果您的审核量较大,或有相对固定的审核需求,建议预先购买资源包的方式。购买资源包规格越大,享受越低折扣,支持叠加购买和使用。更多内容,请参见购买内容审核增强版抵扣资源包

该资源包用于内容审核增强版用量的抵扣,无法与内容安全流量包共享,具体的抵扣系数如下:

审核类型支持的业务场景(服务)抵扣系数
文本审核通用(text_standard)
  • 用户昵称:nickname_detection
  • 私聊互动:chat_detection
  • 公聊评论:comment_detection
  • 教学物料PGC:pgc_detection
  • AIGC文字指令:ai_art_detection
  • 广告法合规:ad_compliance_detection
抵扣系数为1,表示每成功调用一次接口,抵扣资源包的流量包容量规格1次。

例如购买的资源包的流量包容量规格为10次,当您成功调用1次接口,抵扣流量包容量规格1次,剩余9次。

步骤一:开通服务

在正式使用文本审核增强版功能之前,需要先开通服务。

  1. 访问内容审核增强版购买页,仔细阅读并选中服务协议。
  2. 单击立即开通

步骤二:配置审核规则

文本审核增强版为您内置了一套文本审核的标签,主要包含广告、涉政、辱骂、违禁品、色情、暴恐、灌水、垃圾信息、不良场景、网络暴力。如果内置标签无法满足您的业务需求,可以自定义词库,设置有风险的违规关键词或者在检测文本前需要过滤掉的关键词,然后配置匹配关键词的规则。

  1. 登录内容安全控制台
  2. 在左侧导航栏,选择文本审核 > 规则配置
  3. 配置词库。
    1. 规则配置页签,单击词库管理
    2. 词库管理页签,单击创建词库
    3. 创建词库面板,填写词库名称批量添加词或者上传文件批量导入词库。
      您也可以创建时暂不添加关键词,之后根据业务需要在词库中添加关键词。同一个账号下总共支持添加10万个关键词,最多可创建20个词库。单个关键词不允许超过20字,不支持输入特殊字符。
    4. 单击确定
      如果词库创建失败,会有具体的提示信息,您可以根据提示重新创建。

      单击操作管理或者清空,可以修改关键词或者一键清除所有关键词。

  4. 配置规则。
    1. 规则配置页签,选择目标服务,单击右侧操作设置
    2. 设置面板,选择用于过滤的词库。然后单击下一步
      过滤词库的关键词与待审核文本匹配成功后,先进行过滤再检测。该场景主要对一些关键词加入白名单,不需要检测。

      例如,设置的过滤词库中的关键词为方便快捷。此时,待审核的文本为本校小额贷款,安全、快捷、方便、无抵押,随机随贷,当天放款,上门服务,那么方便快捷先被过滤掉,只对本校小额贷款,安全、无抵押,随机随贷,当天放款,上门服务进行文本风险检测。

    3. 选择用于命中的词库,然后单击确定
      命中词库的任何一个关键词只要与待审核文本匹配成功后,使用API调用文本审核增强版时labels会返回C_customized(用户库命中,表示命中您创建的词库)。该场景主要是检测待审核文本中是否存在违规风险。

      例如,设置的命中词库中的关键词为小额贷款上门服务。此时,待审核的文本为本校小额贷款,安全、快捷、方便、无抵押,随机随贷,当天放款,上门服务,那么进行文本风险检测时,会匹配到小额贷款上门服务关键词。使用API调用文本审核增强版时返回参数labels的值除了返回内置的标签外(如果匹配到会返回,否则不返回),还会返回C_customized

    规则配置完成后,会在3分钟后生效,请您耐心等待。

步骤三:接入文本审核增强版

目前,文本审核增强版支持以下两种接入方式。

步骤四:查看审核结果

你可以通过查看审核的结果,分析审核文本中高频的违规类型。

  1. 登录内容安全控制台
  2. 在左侧导航栏,选择文本审核 > 结果查询
  3. 结果查询页面,查看审核的文本、命中的标签及请求时间。
    您可以设置查询时间范围、请求ID、文本、标签搜索待查询的信息。支持查询30天以内的数据,结果查询页面最多可以保存5万条数据,如果您有更高的存储需求,在调用API后需要您自行保存返回结果。
  4. 定位到某条文本内容,单击右侧操作列的查看
  5. 查看详情面板,查看该条文本内容被审核的详细信息。
    详情

步骤五:统计用量

统计调用量数据,帮助您了解近期的文本审核增强版的调用量。

  1. 在左侧导航栏,选择文本审核 > 用量统计
  2. 用量统计页面,查看文本审核的调用量。
    您可以自定义查询时间范围,支持最近的365天内的调用量。您也可以单击按天按月查询,按天默认显示最近的30天内每天的调用量,按月默认显示最近12个月内每个月的调用量。

    单击下载图标,下载用量统计数据。

    用量