阿里云首页 自然语言处理

直播ASR乱码识别

直播ASR乱码识别服务适用于直播场景,通过ASR语音转文字,识别由于多人同时说话导致的文字可读性不佳的问题。使用示例如下。

说明

本预训练模型提供的服务无需自主标注训练,直接调用API即可使用;

服务开通与资源包购买

预训练模型使用前,请确认是否已经开通了NLP自学习平台服务,开通后可购买优惠资源包。

NLP自学习平台:开通地址

自学习平台资源包:购买地址

Java代码示例

DefaultProfile defaultProfile = DefaultProfile.getProfile("cn-hangzhou","your-access-id-key","your-access-id-secret");
IAcsClient client = new DefaultAcsClient(defaultProfile);
Map<String, Object> map = new HashMap<>();
map.put("input", "给自己一个加速加速加速加速");
RunPreTrainServiceRequest request = new RunPreTrainServiceRequest();
request.setServiceName("E-Game-Language-Model");
request.setPredictContent(JSON.toJSONString(map));
RunPreTrainServiceResponse response = client.getAcsResponse(request);
System.out.println(response.getPredictResult());

Python代码示例

# 安装依赖
pip install aliyun-python-sdk-core
pip install aliyun-python-sdk-nlp-automl
# -*- coding: utf8 -*-
import json
from aliyunsdkcore.client import AcsClient
from aliyunsdkcore.acs_exception.exceptions import ClientException
from aliyunsdkcore.acs_exception.exceptions import ServerException
from aliyunsdknlp_automl.request.v20191111 import RunPreTrainServiceRequest
# Initialize AcsClient instance
client = AcsClient(
  "<your-access-key-id>",
  "<your-access-key-secret>",
  "cn-hangzhou"
);
content ={"input": "给自己一个加速加速加速加速"}
# Initialize a request and set parameters
request = RunPreTrainServiceRequest.RunPreTrainServiceRequest()
request.set_ServiceName('E-Game-Language-Model')
request.set_PredictContent(json.dumps(content))
# Print response
response = client.do_action_with_exception(request)
resp_obj = json.loads(response)
predict_result = json.loads(resp_obj['PredictResult'])
print(predict_result['result'])

PredictContent内容示例

{
  "input": "给自己一个加速加速加速加速"
}

PredictResult内容示例

{
  "label": [
    {
      "preplexity ": 48.247,
      "is_readable": True
    }
  ]
}

入参说明

参数

说明

input

ASR语音转文本的结果,长度不超过600

出参说明

参数

说明

is_readable

bool类型,true表示ASR结果可读性好,可以直接展示;falase表示ASR结果可读性不好,不建议直接展示

preplexity

语言模型困惑度,供参考