文本审核增强版升级检测能力,帮助用户识别第三方URL链接是否存在欺诈、色情、赌博等风险,守护平台内容生态。本文介绍文本审核用于检测URL风险的服务以及使用方法。
功能特性
文本审核增强版提供以下审核服务能够支持URL链接风险检测,在使用场景和特性上有所区别,请您根据业务特点选择匹配的服务。
使用场景 | 支持的文本审核服务 | 特性说明 |
适用于用户聊天或评论内容,同时识别文本内容和其中可能存在的URL链接风险。 | 服务名称:公聊评论内容检测 service:comment_detection |
|
适用于应用内置浏览器,URL链接发布或者分享功能,短信内URL链接等场景,单独对URL链接进行风险检测。 | 服务名称:URL风险链接检测 service:url_detection |
|
检测能力
文本审核增强版URL检测服务采用如下标签结构,能够在识别URL链接风险的同时返回其基础信息:
检测能力 | 说明 |
风险标签 |
|
基础信息 |
|
支持URL格式
文本审核增强版URL检测服务支持符合以下格式的URL地址:http(s)://{IP或域名}{:端口}{/路径}
URL地址可以没有HTTP或HTTPS前缀
域名部分是数字、字母组成,英文点号分隔,一级域名2-6个字母
端口部分支持1-4个数字
路径支持数字、字母、及常见字符,例如_!~*'().;?:@&=+$,%#-)等,不能有中文
如果输入URL地址不符合该格式,会返回错误码 BAD_REQUEST(400)。
计费说明
文本审核增强版服务支持按量后付费和资源包抵扣两种付费方式。
按量后付费
当您开通文本审核增强版服务后,默认付费方式是按量后付费,且按照实际用量结算当日费用,不调用服务不收费。
审核类型 | 支持的业务场景(服务) | 计费单价 |
文本审核通用(text_standard) | URL风险链接检测:url_detection | 7.5元/万次 |
资源包抵扣
如果您的审核量较大,或有相对固定的审核需求,建议预先购买资源包的方式。购买资源包规格越大,享受的折扣越大,支持叠加购买和使用。更多内容,请参见购买内容审核增强版抵扣资源包。
该资源包用于内容审核增强版用量的抵扣,无法与内容安全流量包共享,具体的抵扣系数如下:
审核类型 | 支持的业务场景(服务) | 抵扣系数 |
文本审核通用(text_standard) | URL风险链接检测:url_detection | 抵扣系数为1,表示每成功调用一次接口,抵扣资源包的流量包容量规格1次。 例如购买的资源包的流量包容量规格为10次,当您成功调用1次接口,抵扣流量包容量规格1次,剩余9次。 |
接入指南
步骤一:开通服务
访问开通服务,开通文本审核增强版服务。
开通文本增强版服务后,默认付费方式是按量后付费,且按照实际用量结算当日费用,不调用服务不收费。接口接入使用后系统会按使用量自动出账,具体信息,请参见计费说明。您也可以购买按量抵扣资源包,资源包相较于后付费存在一定阶梯折扣,适合使用量级可预期和较大的用户。
步骤二:为RAM用户授权
在接入SDK或者API之前,您需要为RAM用户授权。您可以为阿里云账号和RAM用户创建一个访问密钥(AccessKey)。在调用阿里云API时您需要使用AccessKey完成身份验证。获取方式,请参见获取AccessKey。
使用RAM管理员登录RAM控制台。
- 创建RAM用户。
具体操作,请参见创建RAM用户。
- 向RAM用户授权系统策略权限:
AliyunYundunGreenWebFullAccess
。具体操作,请参见为RAM用户授权。
完成以上配置后,您可以使用RAM用户调用内容安全API。
步骤三:安装并接入SDK
目前支持的接入地域如下,文本审核增强版服务SDK请参考接入指南的文本审核增强版通用服务部分。
地域 | 外网接入地址 | 内网接入地址 |
华东2(上海) | green-cip.cn-shanghai.aliyuncs.com | green-cip-vpc.cn-shanghai.aliyuncs.com |
华北2(北京) | green-cip.cn-beijing.aliyuncs.com | green-cip-vpc.cn-beijing.aliyuncs.com |
华东1(杭州) | green-cip.cn-hangzhou.aliyuncs.com | green-cip-vpc.cn-hangzhou.aliyuncs.com |
华南1(深圳) | green-cip.cn-shenzhen.aliyuncs.com | green-cip-vpc.cn-shenzhen.aliyuncs.com |
西南1(成都) | green-cip.cn-chengdu.aliyuncs.com | 暂无 |
API
使用说明
业务接口:https://green-cip.{region}.aliyuncs.com
。
您可以调用该接口创建文本内容检测任务。关于如何构造HTTP请求,请参见请求结构;您也可以直接选用已构造好的HTTP请求,更多信息,请参见接入指南。
计费信息:
该接口为收费接口。仅对HTTP状态码为200的请求进行计量计费,产生其他错误码时不会计费。关于计费方式,请参见计费说明。
QPS限制
本接口的单用户QPS限制为100次/秒。超过限制,API调用会被限流,这可能会影响您的业务,请合理调用。
请求参数
名称 | 类型 | 是否必须 | 示例值 | 描述 |
Service | String | 是 | url_detection | 审核服务类型。取值:
|
ServiceParameters | JSONString | 是 | 审核服务需要的参数集。JSON字符串格式,关于每个字符串的描述见下表。 |
表 1. ServiceParameters
名称 | 类型 | 是否必须 | 示例值 | 描述 |
content | String | 是 | 检测内容 | 审核的URL内容,限定在600字符以内。 |
accountId | String | 否 | 10123**** | 账户ID,标识一个账户的唯一ID。 |
deviceId | String | 否 | 20240307**** | 设备ID,标识一个设备的唯一ID。 |
deviceToken | String | 否 | MzQvo1d7scyZ3tl_RcJ****** | 通过风险控制SDK获取到的设备令牌。 |
返回参数
名称 | 类型 | 示例值 | 描述 |
Code | Integer | 200 | 错误码。更多信息,请参见Code说明。 |
Data | JSONObject | {"labels":"sexuality","reason":"..."} | 审核结果数据,具体信息请参见Data。 |
Message | String | OK | 请求消息的响应消息。 |
RequestId | String | AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE**** | 请求ID。 |
表 2.Data
名称 | 类型 | 示例值 | 描述 |
Labels | String | sexual_content | 标签,多个标签用英文逗号(,)分隔。包括:
|
Reason | String | {\"icpType\":\"企业\",\"icpNo\":\"ICP备123456789\",\"score\":\"90\"} | 更多信息的JSON字符串。包含以下字段:
|
AccountId | String | 10123**** | 账户ID。 说明 如果在检测请求参数中传入了accountId,则此处返回对应的accountId。 |
DeviceId | String | 20240307**** | 设备ID。 说明 如果在检测请求参数中传入了deviceId,则此处返回对应的deviceId。 |
示例
请求示例
{
"Service": "url_detection",
"ServiceParameters": {
"content": "http://aliyun.com/abc",
"accountId": "10123****"
}
}
正常返回示例
{
"Code": 200,
"Data": {
"Labels": "unmarked_url",
"Reason": "{\"icpType\":\"企业\",\"icpNo\":\"ICP123XXXX789\",\"score\":\"60\"}"
},
"Message": "OK",
"RequestId": "AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****"
}
Code说明
Code | 状态代码 | 说明 |
200 | OK | 请求成功。 |
400 | BAD_REQUEST | 请求有误。可能是请求参数不正确导致,请仔细检查请求参数。 |
407 | NOT_SUPPORT | 无法识别或不支持该语种类型。 |
408 | PERMISSION_DENY | 可能是您的账号未授权、账号欠费、账号未开通、账号被禁等。 |
500 | GENERAL_ERROR | 错误。可能是服务端临时出错。建议重试,若持续返回该错误码,请通过在线服务联系我们。 |
581 | TIMEOUT | 超时。建议重试,若持续返回该错误码,请通过在线服务联系我们。 |
588 | EXCEED_QUOTA | 请求频率超出配额。 |