拼音
该文档是开发者在产品功能集成阶段 使用的中文拼音评测题型的技术说明文档
题型描述
支持拼音、声母或韵母,可以指定声调。
反馈总分,流利度得分,每个拼音的得分,每个拼音的声韵母得分,声调得分,以及用户音频地址。
测评请求参数
字段 | 类型 | 可选 | 说明 |
coreType | String | 必选 | cn.raw.score表示中文拼音题型 |
refText | String | 必选 | 评分参考文本, 注:内容全部都是拼音(不指定调时,默认为轻声),支持只传声母或者韵母 ,例如 {"refText":"b p, a o, a1 o1,hao3 hao xue2 xi2 "} |
rank | int | 可选 | 评分分制,这个值可以任意设置,最终会根据与100的比例重新计算 |
precision | double | 可选 | 设置打分精度,0.1、0.5或者1,默认为1 |
typeThres | int | 可选 | 打分松紧度(分数越高影响越小):1表示严格,2表示宽松,3表示非常严格,4非常宽松,0为默认值(不启用此功能) |
attachAudioUrl | int | 可选 | 评测结果中是否返回音频url |
参数示例
{
"coreType":"cn.raw.score",
"refText":"guo4 qu4 nai3 nai yi1 ge4 ren2 yao4 zuo4 er4 shi2 lai2 ge4 ren2 de fan4. ",
"typeThres":1,
"attachAudioUrl":1
}返回结果示例
{
"tokenId": "611f502188bf5b0000070001" , //用户请求的唯一标识
"applicationId": "aXXX", //授权的Appkey
"audioUrl": "http:\/\/files.cloud.ssapi.cn:8080\/a148\/11ec01828d53e9a1808aa148v2618ae7", //用户音频地址
"connect": { //内部参数不需要关注
"param": {
"app": { //内部参数不需要关注
"timestamp": "1629442002",
"applicationId": "a148",
"sig": "f79bf828f5dfd7ee16a14b1d18a4c3ee5d89a6e4"
},
"sdk": { //内部参数节点不需要关注
"os": "6.2(9200)1",
"product": "",
"source": 7,
"protocol": 1,
"os_version": "6.2(9200)",
"arch": "586",
"version": 16778752
}
},
"cmd": "connect"
},
"params": {
"app": { //内部参数节点不需要关注
"timestamp": "1629442081",
"userId": "ssound_text",
"sig": "8f75f190cd1eb11e2556d486f82cc4942429633f",
"connect_id": "611f4fd288bf5b0000060002",
"clientId": "",
"applicationId": "a148"
},
"audio": { //音频参数节点
"sampleBytes": 2, //每采样字节数,支持单字节和双字节
"audioType": "ogg", //音频格式类型
"sampleRate": 16000, //采样率
"channel": 1 //单声道,评测仅支持单声道
},
"request": { //请求评分,客户端传入参数
"typeThres": 1, //松紧度,1代表严格
"tokenId": "611f502188bf5b0000070001",
"coreType": "cn.raw.score", //题型类型
"attachAudioUrl": 1,
"request_id": "611f502188bf5b0000080001",
"refText": "guo4 qu4 nai3 nai yi1 ge4 ren2 yao4 zuo4 er4 shi2 lai2 ge4 ren2 de fan4. " //评测文本
}
},
"recordId": "11ec01828d53e9a1808aa148v2618ae7",
"refText": "guo4 qu4 nai3 nai yi1 ge4 ren2 yao4 zuo4 er4 shi2 lai2 ge4 ren2 de fan4. ",
"dtLastResponse": "2021-08-20 14:48:05:405", //云端响应的时间点
"cloud_platform": {
"origin_audio_length": 26691
},
"result": { //评测结果节点
"overall": 90, //总分
"forceout": 0, //内部参数,无需关注
"precision": 1, //评测请求时设置的打分精度,只支持0.1、0.5或者1,默认值为1(如果设置的值不是0.1或0.5则按1处理)
"systime": 7346, //评测整个过程的总耗时,单位ms
"res": "chn.raw.online.1.0", //评测使用的资源名称
"delaytime": 52,
"fluency": {
"pause": 2,
"overall": 80,
"speed": 2
},
"tone": 97, //声调得分
"pron": 91, //发音得分,即准确度得分
"wavetime": 6990, //音频时长,单位ms
"accuracy": 91, //发音得分,即准确度得分
"phn": 88, //音素发音得分
"version": "0.0.80.2021.7.24.00:01:28", //评测使用的资源版本
"info": {
"tipId": 10006, //音频质量,详情请参考tipId字段说明
"clip": 0, //音频声音太高,出现截幅,范围(0~1)。此参数影响评分时,会设置相应的tipId值
"snr": 2.888726, //信噪比,值越高越清晰,范围(0~40dB) 此参数影响评分时,会设置相应的tipId值
"volume": 84 //录音音量,范围(0~180dB)
},
"rank": 100, //评测请求时设置的总分分制,这个值可以任意设置,最终会根据与100的比例重新计算(不传,默认按100处理)
"integrity": 100, //完整度评分
"pretime": 10,
"details": [ //句子详情节点
{
"tonescore": 100, //单字声调得分
"dur": 280, //单字在音频中的结束时间,单位为毫秒(ms)
"confidence": [ //置信度,里面的值依次表示这个字对应的声调为:轻声、一声、二声、三声、四声 的概率
0,
0,
0,
0,
100
],
"char": "guo4",
"tone": 4, //单字声调,0~4分别对应轻声、一声、二声、三声,四声
"start": 400, //单字在音频中的起始时间,单位为毫秒(ms)
"score": 96, //单字发音得分
"end": 680, //单字发音时间,单位为毫秒(ms)
"fluency": 100 //流利度评分
},
{
"tonescore": 100,
"dur": 360,
"confidence": [
0,
0,
0,
0,
100
],
"char": "qu4",
"tone": 4,
"start": 680,
"score": 90,
"end": 1040,
"fluency": 83
},
{
"tonescore": 99,
"dur": 280,
"confidence": [
0,
0,
2,
98,
0
],
"char": "nai3",
"tone": 3,
"start": 1040,
"score": 92,
"end": 1320,
"fluency": 83
},
{
"tonescore": 98,
"dur": 400,
"confidence": [
98,
0,
2,
0,
0
],
"score": 96,
"char": "nai",
"end": 1720,
"start": 1320,
"is_pause": 1,
"tone": 0,
"fluency": 83
},
{
"tonescore": 56,
"dur": 240,
"confidence": [
0,
16,
81,
4,
0
],
"char": "yi1",
"tone": 1,
"start": 2200,
"score": 59,
"end": 2440,
"fluency": 100
},
{
"tonescore": 100,
"dur": 220,
"confidence": [
0,
0,
0,
0,
100
],
"char": "ge4",
"tone": 4,
"start": 2440,
"score": 92,
"end": 2660,
"fluency": 100
},
{
"tonescore": 100,
"dur": 440,
"confidence": [
0,
0,
100,
0,
0
],
"score": 96,
"char": "ren2",
"end": 3100,
"start": 2660,
"is_pause": 1,
"tone": 2,
"fluency": 61
},
{
"tonescore": 99,
"dur": 360,
"confidence": [
0,
1,
0,
0,
98
],
"char": "yao4",
"tone": 4,
"start": 3460,
"score": 93,
"end": 3820,
"fluency": 67
},
{
"tonescore": 100,
"dur": 380,
"confidence": [
0,
0,
0,
0,
99
],
"char": "zuo4",
"tone": 4,
"start": 3820,
"score": 91,
"end": 4200,
"fluency": 89
},
{
"tonescore": 100,
"dur": 260,
"confidence": [
0,
0,
0,
0,
100
],
"char": "er4",
"tone": 4,
"start": 4220,
"score": 99,
"end": 4480,
"fluency": 95
},
{
"tonescore": 99,
"dur": 340,
"confidence": [
0,
1,
97,
1,
2
],
"char": "shi2",
"tone": 2,
"start": 4480,
"score": 88,
"end": 4820,
"fluency": 87
},
{
"tonescore": 100,
"dur": 340,
"confidence": [
0,
0,
100,
0,
0
],
"char": "lai2",
"tone": 2,
"start": 4820,
"score": 88,
"end": 5160,
"fluency": 96
},
{
"tonescore": 100,
"dur": 280,
"confidence": [
0,
0,
0,
0,
100
],
"char": "ge4",
"tone": 4,
"start": 5160,
"score": 85,
"end": 5440,
"fluency": 77
},
{
"tonescore": 100,
"dur": 400,
"confidence": [
0,
0,
100,
0,
0
],
"char": "ren2",
"tone": 2,
"start": 5440,
"score": 98,
"end": 5840,
"fluency": 65
},
{
"tonescore": 100,
"dur": 260,
"confidence": [
100,
0,
0,
0,
0
],
"char": "de",
"tone": 0,
"start": 5840,
"score": 96,
"end": 6100,
"fluency": 100
},
{
"tonescore": 100,
"dur": 320,
"confidence": [
0,
0,
0,
0,
100
],
"char": "fan4",
"tone": 4,
"start": 6100,
"score": 92,
"end": 6420,
"fluency": 84
}
]
},
"eof": 1
}返回结果说明
键 | 类型 | 说明 | 使用建议 |
tokenId | string | 用户请求的唯一标识 | 可供参考 |
applicationId | string | 授权账号,即用户的Appkey | 内部参数 |
audioUrl | string | 用户音频下载地址: | |
recordId | string | 音频文件的唯一标识 | |
refText | string | 传入的评测文本 | |
dtLastResponse | string | 云端响应的时间点 | 内部参数 |
eof | int | 内部参数 | |
params | object | 回显客户端传入的评测请求参数 | |
- app | object | ||
- - applicationId | string | 授权账号 | |
- - userId | string | 产品端的用户标识,可以是自定义的自符串,建议一个用户一个userid,方便排查问题 | |
- - timestamp | string | start时间 | |
- - sig | string | 校验码 | |
- request | object | ||
- - coreType | string | 使用引擎 | |
- - tokenId | string | 用户请求的唯一标识 | |
- - refText | string | 评分参考文本 | |
- - rank | int | 评分分制 | |
- - precision | float | 打分精度 | |
- - attachAudioUrl | int | 评分结果中是否包含音频url | |
- audio | object | ||
- - sampleRate | int | 采样率 | |
- - channel | int | 声道 | |
- - sampleBytes | int | 每采样字节数,支持单字节和双字节 | |
- - audioType | string | 音频格式 | |
result | object | 评测结果 | |
- overall | float | 总分 | 内部参数 |
- precision | float | 评分精度 | 内部参数 |
- systime | int | 评测整个过程的总耗时,单位ms | |
- res | string | 评测本题型时,使用的资源名称 | 内部参数 |
-fluency | object | 流利度情况 | |
- -pause | int | 是否停顿 | |
- -overall | float | 流利度分 | |
- -speed | int | 语速快慢,0:慢,1:正常,2:快 | |
-tone | float | 声调得分 | 保留备用 |
- accuracy | float | 发音得分(同pron字段) | |
- phn | float | 音素发音得分 | |
-version | string | 引擎的版本,包含发布时间 | |
- rank | int | 评分分制 | |
- integrity | float | 完整度评分 | 建议字段 |
- pretime | int | 云端调用Start接口本身耗时,单位ms | |
- pron | float | 发音分 | 内部参数 |
-overall | float | 总分 | 建议字段 |
-delaytime | int | 云端从feed音频结束到获取结果的耗时,单位ms | 内部参数 |
-wavetime | int | 音频时长 | 可供参考 |
- info | object | ||
- - snr | float | 信噪比 | 可供参考 |
- - clip | float | 音频声音太高,出现截幅,范围(0\~1)。 此参数影响评分时,会设置相应的tipId值 | 内部参数 |
- - tipId | int | 音频质量 | 建议字段 |
- volume | int | 如开启vad功能,返回此参数,表示录音的音量值 | 可供参考 |
- details | array | 拼音详情 | 建议字段 |
- - fluency | float | 流利度评分 | 保留备用 |
- - dur | int | 发音时间 | 可供参考 |
- - tone | int | 单个拼音或声韵母声调 | 0~4分别对应轻声、一声、二声、三声、四声 |
- - tonescore | int | 单个拼音或声韵母声调得分 | |
- - score | float | 单个拼音或声韵母得分 | |
- - char | string | 单个拼音或声韵母 | |
- - confidence | array | 置信度 | 里面的值依次表示这个字对应的声调为:轻声、一声、二声、三声、四声 的概率。 |
- - end | int | 单个拼音或声韵母发音时间,单位为毫秒(ms) | |
- - start | int | 单个拼音或声韵母在音频中的起始时间,单位为毫秒(ms) |
返回结果说明
维度 | 说明 | 详细 |
overall | 总分 | 整体评分 |
pron | 发音分 | |
fluency. overall | 流利度总分 | |
details.tonescore | 单个声调得分 | 单个拼音或声韵母声调得分 |
details.score | 单个得分 | 单个拼音或声韵母得分 |
评测失败时的返回结果
如果返回的评测结果中result结构为空,说明评测失败。
通过返回结果可以获取 errId 和 error,产品端可以根据相应错误码做续判断和处理。
错误码
错误码参考:评测错误码