音标
该文档是开发者在产品功能集成阶段 使用的音标跟读题型的语音评测技术文档
题型描述
对英文音标进行打分,反馈维度包含音标总分、发音得分及对应音素得分情况。
测评请求参数
字段 | 类型 | 可选 | 说明 |
coreType | String | 必选 | en.alpha.score表示英文音标评测 |
refText | String | 必选 | 评分参考文本,仅支持音标,如需评测多个音标,需用空格隔开 |
rank | int | 可选 | 评分分制,这个值可以任意设置,最终会根据与100的比例重新计算 |
precision | double | 可选 | 设置打分精度,只支持0.1、0.5或者1,默认值为1(如果设置的值不是0.1或0.5则按1处理) |
参数示例
{
"coreType": "en.alpha.score",
"refText": "ih",
"rank": 100,
"precision": 0.1
}返回结果示例
{
“applicationId”: “aXXX”, //授权的Appkey
"tokenId": "5a4edc47000df30000090004", //用户请求的唯一标识
"recordId": "5a4edc9d28c338dabd000008", //音频文件的唯一标识
"dtLastResponse": "2021-08-09 10:02:08:609", //云端响应的时间点
"result": { //评测结果节点
"forceout": 0,
"pron": 97.3, //发音得分,即准确度得分
"version": "0.0.80.2018.1.3.11:10:55", //评测使用的资源版本
"rank": 100,
"pretime": 2,
"delaytime": 51, //云端从feed音频结束到获取结果的耗时,单位ms
"overall": 97.3, //总分
"info": {
"tipId": 10006, //音频质量,详情请参考tipId字段说明
"clip": 0, //音频声音太高,出现截幅,范围(0~1)。此参数影响评分时,会设置相应的tipId值
"snr": 2.888726, //信噪比,值越高越清晰,范围(0~40dB) 此参数影响评分时,会设置相应的tipId值
"volume": 84 //录音音量,范围(0~180dB)
},
"wavetime": 1990, //音频时长,单位ms
"systime": 2774,
"details": [ //音素节点反馈
{
"dur": 330, //单词发音时间,单位ms
"phone": [ //音素级评分结果,返回的是内部音素,详情请参考音素对照表
{
"char": "ih",
"score": 97 //发音得分
}
],
"char": "ih", //内部音素
"end": 1030, //该音素发音结束时间,单位ms
"start": 700, //该音素发音开始时间,单位ms
"score": 97 //音素得分
}
],
"precision": 0.1, //评测请求时设置的打分精度,只支持0.1、0.5或者1,默认值为1(如果设置的值不是0.1或0.5则按1处理)
"res": "eng.alpha.online.0.1" //评测使用的资源名称
},
"eof": 1,
"params": {
"app": { //内部参数节点不需要关注
"timestamp": "1515117639",
"sig": "76f93b03334e890f7fcd683e02b5c8c619d87e97",
“applicationId”: “aXXX”,
"userId": "ssound_text",
"clientId": ""
},
"request": {
"coreType": "en.alpha.score",
"tokenId": "5a4edc47000df30000090004",
"refText": "ih",
"precision": 0.1,
"rank": 100
},
"audio": { //音频参数节点
"sampleRate": 16000, //采样率
"channel": 1, //单声道,评测仅支持单声道
"sampleBytes": 2, //每采样字节数,支持单字节和双字节
"audioType": "ogg" //音频格式类型
}
},
"refText": "ih"
}返回结果说明
键 | 类型 | 说明 | 使用建议 |
recordId | string | 音频文件的唯一标识 | 可供参考 |
tokenId | string | 用户请求的唯一标识 | 可供参考 |
applicationId | string | 授权账号,提供的评测Appkey | 内部参数 |
dtLastResponse | string | 云端响应的时间点 | 内部参数 |
eof | int | 0表示返回未结束,后续还有其它的返回结果 1:表示本次评测所有的返回结束s | 内部参数 |
refText | string | 传入的评测文本 | 可供参考 |
params | object | 回显客户端传入的评测请求参数 | |
- app | object | ||
- - applicationId | string | 授权账号,提供的评测Appkey | |
- - userId | string | 用户标识 | |
- - timestamp | string | start时间 | |
- - sig | string | 校验码 | |
- request | object | 评分请求参数节点 | |
- audio | object | 评分请求的音频参数节点 | |
result | object | 评测结果 | |
- version | string | 引擎的版本,包含发布时间 | 内部参数 |
- rank | int | 评分分制 | 内部参数 |
- precision | float | 评分精度 | 内部参数 |
- res | string | 评测本题型时,使用的资源名称 | 内部参数 |
- forceout | int | 内部参数 | |
- pretime | int | 云端调用Start接口本身耗时,单位ms | 内部参数 |
- systime | int | 评测整个过程的总耗时,单位ms | 内部参数 |
- delaytime | int | 云端从feed音频结束到获取结果的耗时,单位ms | 内部参数 |
- wavetime | int | 音频时长,单位ms | 可供参考 |
- overall | float | 总分 | 建议字段 |
- pron | float | 发音分 | 内部参数 |
- details | array | ||
- - start | int | 音标在音频中的起始时间,单位ms | 可供参考 |
- - end | int | 音标在音频中的结束时间,单位ms | 可供参考 |
- - dur | int | 音标发音时间,单位ms | 可供参考 |
- - char | string | 规整后的音标文本 | 可供参考 |
- - score | int | 音标得分 | 可供参考 |
- - phone | array | 音素级评分结果节点 | |
- - - char | string | 音素 | 可供参考 |
- - - score | int | 音素得分(0-100) | 可供参考 |
- info | object | ||
- - snr | float | 信噪比,值越高越清晰,范围(0~40dB) 此参数影响评分时,会设置相应的tipId值 | 可供参考 |
- - clip | float | 音频声音太高,出现截幅,范围(0\~1)。 此参数影响评分时,会设置相应的tipId值 | 内部参数 |
- - volume | int | 录音音量,范围(0~180dB) | 可供参考 |
- - tipId | int | 音频质量,请参考 tipId提示信息说明 | 建议字段 |
评测结果展现建议
维度 | 说明 | 详细 |
overall | 总分 | 对整体音标发音情况进行总体评分 |
pron | 发音得分 | 对整体音标发音进行评分 |
detials[i].score | 得分 | 对每个音标的发音评分。获取之前要进行非空判断 |
details[i] phone[i].score | 得分 | 对每个音素的发音评分 |
评测失败时的返回结果
如果返回的评测结果中result结构为空,说明评测失败。
通过返回结果可以获取 errId 和 error,产品端可以根据相应错误码做续判断和处理。
错误码
错误码参考:评测错误码