如何使用脏话识别服务_自然语言处理(NLP)-阿里云帮助中心

辱骂识别服务适用于电销场景客服质检、直播场景主播监管等应用场景。

说明

本服务由NLP自学习平台提供，直接调用API即可使用。

服务开通与资源包购买

使用前，请确认是否已经开通服务，开通后可购买资源包。

服务开通：开通地址
购买资源包：购买地址

服务调用与调试

模型调用文档参考：模型调用

SDK示例文档参考：SDK示例

调试

您可以在OpenAPI开发者门户中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI开发者门户可以自动生成SDK代码示例。

通过环境变量配置访问凭证（AKSK）

说明：
1. 阿里云账号AccessKey拥有所有API的访问权限，风险很高。强烈建议您创建并使用RAM用户进行API访问或日常运维，请登录RAM控制台创建RAM用户。
2. 强烈建议不要把AccessKey和AccessKeySecret保存到代码里，会存在密钥泄漏风险，在此提供通过配置环境变量的方式来保存和访问aksk
Linux和macOS系统配置方法
```
export NLP_AK_ENV=<access_key_id>
export NLP_SK_ENV=<access_key_secret>
```
其中<access_key_id>替换为已准备好的AccessKey ID，<access_key_secret>替换为AccessKey Secret，AccessKey ID和AccessKey Secret的获取方式见步骤二：获取账号的AccessKey
Windows系统配置方法
1. 新建环境变量文件，添加环境变量NLP_AK_ENV和NLP_SK_ENV，并写入已准备好的AccessKey ID和AccessKey Secret。
2. 重启Windows系统。

Java代码示例

/**
 * 阿里云账号AccessKey拥有所有API的访问权限，风险很高。强烈建议您创建并使用RAM用户进行API访问或日常运维，请登录RAM控制台创建RAM用户。
 * 此处以把AccessKey和AccessKeySecret保存在环境变量为例说明。您也可以根据业务需要，保存到配置文件里。
 * 强烈建议不要把AccessKey和AccessKeySecret保存到代码里，会存在密钥泄漏风险
 */
String accessKeyId = System.getenv("NLP_AK_ENV");
String accessKeySecret = System.getenv("NLP_SK_ENV");
DefaultProfile defaultProfile = DefaultProfile.getProfile("cn-hangzhou",accessKeyId,accessKeySecret);
IAcsClient client = new DefaultAcsClient(defaultProfile);
String content = "{\"session_id\": 0, \"text\": \"不是不是你这句话，**又有节奏。你不要说我说什么话都有节奏，**不怕我**的干嘛，我就说了咋地，**我不怕没有延迟的马路，***这种话怎么怎么了，**没怎么没怎么没怎么，只不过是这么说而已。\"}";
RunPreTrainServiceRequest request = new RunPreTrainServiceRequest();
request.setServiceName("NLP-Dialog-Risk");
request.setPredictContent(content);
RunPreTrainServiceResponse response = client.getAcsResponse(request);
System.out.println(response.getPredictResult());

Python代码示例

# 安装依赖
pip install aliyun-python-sdk-core
pip install aliyun-python-sdk-nlp-automl

# -*- coding: utf8 -*-
import json
import os

from aliyunsdkcore.client import AcsClient
from aliyunsdkcore.acs_exception.exceptions import ClientException
from aliyunsdkcore.acs_exception.exceptions import ServerException
from aliyunsdknlp_automl.request.v20191111 import RunPreTrainServiceRequest

/**
 * 阿里云账号AccessKey拥有所有API的访问权限，风险很高。强烈建议您创建并使用RAM用户进行API访问或日常运维，请登录RAM控制台创建RAM用户。
 * 此处以把AccessKey和AccessKeySecret保存在环境变量为例说明。您也可以根据业务需要，保存到配置文件里。
 * 强烈建议不要把AccessKey和AccessKeySecret保存到代码里，会存在密钥泄漏风险
 */
access_key_id = os.environ['NLP_AK_ENV']
access_key_secret = os.environ['NLP_SK_ENV']

# Initialize AcsClient instance
client = AcsClient(
  access_key_id,
  access_key_secret,
  "cn-hangzhou"
);
content = {"session_id": 0, "text": "不是不是你这句话，**又有节奏。你不要说我说什么话都有节奏，**不怕我**的干嘛，我就说了咋地，**我不怕没有延迟的马路，***这种话怎么怎么了，**没怎么没怎么没怎么，只不过是这么说而已。"}
# Initialize a request and set parameters
request = RunPreTrainServiceRequest.RunPreTrainServiceRequest()
request.set_ServiceName('NLP-Dialog-Risk')
request.set_PredictContent(json.dumps(content))
# Print response
response = client.do_action_with_exception(request)
resp_obj = json.loads(response)
predict_result = json.loads(resp_obj['PredictResult'])
print(predict_result['result'])

PredictContent内容示例

{
  "session_id": 0, 
  "text": "不是不是你这句话，**又有节奏。你不要说我说什么话都有节奏，**不怕我**的干嘛，我就说了咋地，**我不怕没有延迟的马路，***这种话怎么怎么了，**没怎么没怎么没怎么，只不过是这么说而已。"
}

PredictResult内容示例

{
  "label": "abuse", 
  "keywords": [
    {"end": "64", "begin": "61", "value": "**的"}, 
    {"end": "11", "begin": "9", "value": "**"}, 
    {"end": "38", "begin": "35", "value": "**的"}
  ], 
  "session_id": 0, 
  "prob": "0.542"
}

入参说明

参数	说明

参数	说明
session_id	用于追踪测试样例的id
text	待检测的文本样例

出参说明

参数	说明

参数	说明
label	检测的标签类别 abuse：表示识别到脏话。 normal：表示正常，未识别到脏话。
keywords	返回文本中辱骂相关的关键字list，元素包括起始位置start，结束位置end，以及该关键字的值。
session_id	检测样本的id
prob	辱骂的可能概率，为[0, 1] 之间，值越大表示辱骂的置信度越高。