脏话识别服务

辱骂识别服务适用于电销场景客服质检、直播场景主播监管等应用场景,使用示例如下。

说明

本预训练模型提供的服务无需自主标注训练,直接调用API即可使用;

服务开通与资源包购买

预训练模型使用前,请确认是否已经开通了NLP自学习平台服务,开通后可购买优惠资源包。

NLP自学习平台:开通地址

自学习平台资源包:购买地址

Java代码示例

DefaultProfile defaultProfile = DefaultProfile.getProfile("cn-hangzhou","your-access-key-id","your-access-id-secret");
IAcsClient client = new DefaultAcsClient(defaultProfile);
String content = "{\"session_id\": 0, \"text\": \"不是不是你这句话,你妈又有节奏。你不要说我说什么话都有节奏,老子不怕我他妈的干嘛,我就说了咋地,我靠我不怕没有延迟的马路,你妈的这种话怎么怎么了,我靠没怎么没怎么没怎么,只不过是这么说而已。\"}";
RunPreTrainServiceRequest request = new RunPreTrainServiceRequest();
request.setServiceName("NLP-Dialog-Risk");
request.setPredictContent(content);
RunPreTrainServiceResponse response = client.getAcsResponse(request);
System.out.println(response.getPredictResult());

Python代码示例

# 安装依赖
pip install aliyun-python-sdk-core
pip install aliyun-python-sdk-nlp-automl
# -*- coding: utf8 -*-
import json
from aliyunsdkcore.client import AcsClient
from aliyunsdkcore.acs_exception.exceptions import ClientException
from aliyunsdkcore.acs_exception.exceptions import ServerException
from aliyunsdknlp_automl.request.v20191111 import RunPreTrainServiceRequest
# Initialize AcsClient instance
client = AcsClient(
  "<your-access-key-id>",
  "<your-access-key-secret>",
  "cn-hangzhou"
);
content = {"session_id": 0, "text": "不是不是你这句话,你妈又有节奏。你不要说我说什么话都有节奏,老子不怕我他妈的干嘛,我就说了咋地,我靠我不怕没有延迟的马路,你妈的这种话怎么怎么了,我靠没怎么没怎么没怎么,只不过是这么说而已。"}
# Initialize a request and set parameters
request = RunPreTrainServiceRequest.RunPreTrainServiceRequest()
request.set_ServiceName('NLP-Dialog-Risk')
request.set_PredictContent(json.dumps(content))
# Print response
response = client.do_action_with_exception(request)
resp_obj = json.loads(response)
predict_result = json.loads(resp_obj['PredictResult'])
print(predict_result['result'])

PredictContent内容示例

{
  "session_id": 0, 
  "text": "不是不是你这句话,你妈又有节奏。你不要说我说什么话都有节奏,老子不怕我他妈的干嘛,我就说了咋地,我靠我不怕没有延迟的马路,你妈的这种话怎么怎么了,我靠没怎么没怎么没怎么,只不过是这么说而已。"
}

PredictResult内容示例

{
  "label": "abuse", 
  "keywords": [
    {"end": "64", "begin": "61", "value": "你妈的"}, 
    {"end": "11", "begin": "9", "value": "你妈"}, 
    {"end": "38", "begin": "35", "value": "他妈的"}
  ], 
  "session_id": 0, 
  "prob": "0.542"
}

入参说明

参数

说明

session_id

用于追踪测试样例的id

text

待检测的文本样例

出参说明

参数

说明

label

检测的标签类别,“abuse”或 “normal”

keywords

返回文本中辱骂相关的关键字list,元素包括起始位置start,结束位置end,以及该关键字的值。

session_id

检测样本的id

prob

辱骂的可能概率,为[0, 1] 之间,值越大表示辱骂的置信度越高。

阿里云首页 自然语言处理 相关技术圈