儿童单词
该文档是开发者在产品功能集成阶段 使用的单词跟读题型的语音评测技术,适用于12岁以下儿童单词跟读评测功能
题型描述
对英文单词、词组进行打分。
支持自定义发音进行评分;支持音节重音检测;支持英美式发音区分;
反馈维度包含单词总分,重音判断,音素得分。
评测请求参数
字段 | 类型 | 可选 | 说明 |
coreType | string | 必选 | en.word_kid.score表示英文幼儿单词评测 |
refText | string | 必选 | 评分参考文本, 注:外部指定发音支持以下两种方式: |
rank | int | 可选 | 评分分制,这个值可以任意设置,最终会根据与100的比例重新计算 |
precision | double | 可选 | 设置打分精度,只支持0.1、0.5或者1,默认值为1(如果设置的值不是0.1或0.5则按1处理) |
attachAudioUrl | int | 可选 | 评测结果中是否返回音频url |
typeThres | int | 可选 | 打分松紧度(分数越高影响越小):1表示严格,2表示宽松,3表示非常严格,4非常宽松,0为默认值(不启用此功能) |
accent | string | 可选 | 指定英,美式评分。默认不启用此功能,引擎根据用户发音情况智能判别英美式发音。 |
参数示例
{
"coreType":"en.word_kid.score",
"refText":"egg",
"rank":100,
"attachAudioUrl":1,
"accent":"en"
}返回结果示例
{
"tokenId": "6114e85388bf5b00000a0001",
"applicationId": "aXXX", // 提供的appkey
"audioUrl": "http:\/\/files.cloud.ssapi.cn:8080\/a148\/11ebfb4ecda877958771a148m2611197", //用户音频下载地址
"connect": { //内部参数,无需关注
"param": {
"app": {
"timestamp": "1628760147",
"applicationId": "aXXX",
"sig": "5f82347d335449cc9aa053a4f2f29820f54bbd2f"
},
"sdk": {
"os": "6.2(9200)1",
"product": "",
"source": 7,
"protocol": 1,
"os_version": "6.2(9200)",
"arch": "586",
"version": 16778752
}
},
"cmd": "connect"
},
"params": {
"app": {
"timestamp": "1628760147",
"userId": "ssound_text",
"sig": "5f82347d335449cc9aa053a4f2f29820f54bbd2f",
"connect_id": "6114e85388bf5b00000c0002",
"clientId": "",
"applicationId": "a148"
},
"audio":{ //请求评分的音频格式参数
"sampleRate":16000, //采样率
"channel":1, //声道,1是单声道,2是双声道。评测仅支持单声道
"sampleBytes":2,
"audioType":"ogg" //音频类型
},
"request": { //请求评分的参数节点
"request_id": "6114e85388bf5b00000b0001",
"accent": "en", //请求参数中配置accent时不返回此字段,否则返回此字段"accent"
"rank": 100, //分制,默认是100表示百分制,这个值可以任意设置,最终会根据与100的比例重新计算
"attachAudioUrl": 1, //评测结果中是否返回音频url ; 0: 不返回 ; 1: 返回
"tokenId": "6114e85388bf5b00000a0001",
"refText": "egg", //文本内容
"coreType": "en.word_kid.score" //题型类型
}
},
"recordId": "11ebfb4ecda877958771a148m2611197", //数据在云端的唯一标识,请保存到产品数据库,方便排查问题
"refText": "egg", //文本内容
"dtLastResponse": "2021-08-12 17:22:27:884", //返回数据时间
"cloud_platform": {
"origin_audio_length": 7807
},
"result": {
"pron": 98,
"forceout": 0,
"precision": 1,
"systime": 2104,
"res": "eng.wrd_kid.online.0.2",
"version": "0.0.80.2021.7.24.00:01:28",
"info": {
"tipId": 10004,
"clip": 0,
"snr": 30.070004,
"volume": 77
},
"rank": 100,
"delaytime": 20, //云端从feed音频结束到获取结果的耗时,单位ms
"wavetime": 1990, //音频文件时长
"details": [
{
"stress": [
{
"ref": 0,
"score": 1,
"char": "eh_g"
}
],
"char": "egg",
"dur": 520, //单词发音时间,单位ms
"score": 98, //发音得分
"phone": [ //单词的音素组合
{
"char": "e", //这里返回的是的音素,不是国际音素,如果产品需要使用,需要转换成国际音素
"score": 96, //音素得分
"end": 1460,
"start": 1220
},
{
"char": "g",
"score": 100,
"end": 1740,
"start": 1460
}
],
"end": 1740,
"start": 1220
}
],
"pretime": 23, //云端调用Start接口本身耗时,单位ms
"overall": 98
},
"eof": 1
}返回结果说明
键 | 类型 | 说明 | 使用建议 |
recordId | string | 音频文件的唯一标识 | 可供参考 |
audioUrl | string | 用户音频下载地址: | 可供参考 |
tokenId | string | 用户请求的唯一标识 | 可供参考 |
applicationId | string | 授权账号,提供的评测Appkey | 内部参数 |
dtLastResponse | string | 云端响应的时间点 | 内部参数 |
eof | int | 0表示返回未结束,后续还有其它的返回结果 1:表示本次评测所有的返回结束 | 内部参数 |
refText | string | 传入的评测文本 | 可供参考 |
params | object | 回显客户端传入的评测请求参数 | |
- app | object | ||
- - applicationId | string | 授权账号,即用户的Appkey | |
- - userId | string | 用户标识 | |
- - timestamp | string | start时间 | |
- - sig | string | 校验码 | |
- request | object | 请求评分的参数设置节点 | |
- audio | object | 请求评分的音频参数设置节点 | |
result | object | 评测结果节点 | |
- version | string | 引擎的版本,包含发布时间 | 内部参数 |
- rank | int | 评分分制 | 内部参数 |
- precision | float | 评分精度 | 内部参数 |
- res | string | 评测本题型时,使用的资源名称 | 内部参数 |
- forceout | int | 内部参数 | |
- pretime | int | 云端调用Start接口本身耗时,单位ms | 内部参数 |
- systime | int | 评测整个过程的总耗时,单位ms | 内部参数 |
- delaytime | int | 云端从feed音频结束到获取结果的耗时,单位ms | 内部参数 |
- wavetime | int | 音频时长,单位ms | 可供参考 |
- overall | float | 总分 | 建议字段 |
- pron | float | 发音分 | 内部参数 |
- details | array | ||
- - start | int | 单词在音频中的起始时间,单位ms | 可供参考 |
- - end | int | 单词在音频中的结束时间,单位ms | 可供参考 |
- - dur | int | 单词发音时间,单位ms | 可供参考 |
- - char | string | 规整后的单词文本 | 可供参考 |
- - score | int | 单词得分 | 可供参考 |
- - fake_pron | int | 单词不在词典(集外词),才会输出此字段。如果需要对集外词进行评测,可以通过refText传音标的方式进行评测。 | |
- - dp_type | int | 单词正常朗读(不输出dp_ type字段)、漏读(1)、重复读(2) | |
- - accent | string | 请求参数中配置accent时不返回此字段,否则返回此字段"accent":"ea" | |
- - stress | array | 重音发音 | |
- - - char | string | 音素 | 可供参考 |
- - - ref | int | 标识当前音节是否需要重读. | |
- - - score | int | 重音反馈(0、1) | |
- - phone | array | 音素级评分结果 ,详情请参考音素对照表 | |
- - - char | string | 音素(当请求参数中设置accent时此字段为标准的英美式音素,否则为内部映射音素) | 可供参考 |
- - - score | int | 音素得分(0-100) | 可供参考 |
- - - phid | int | 音素在单词音标中的位置 | 只有设置phdet才输出此字段 |
- - - pherr | int | 检测音素是否有错(0、1) | 只有设置phdet才输出此字段 |
- - - ph2alpha | string | 音素对应的字母 | 只有设置phdet才输出此字段 |
- realtime_details | array | 实时反馈信息 | |
-- char | string | 单词 | 供参考 |
-- dp_type | int | 0:表示正常读 1:表示漏读或者未读 2:表示重读 | 供参考 |
- info | object | ||
- - snr | float | 信噪比,值越高越清晰,范围(0~40dB) 此参数影响评分时,会设置相应的tipId值 | 可供参考 |
- - clip | float | 音频声音太高,出现截幅,范围(0\~1)。 此参数影响评分时,会设置相应的tipId值 | 内部参数 |
- - volume | int | 录音音量,范围(0~180dB) | 可供参考 |
- - tipId | int | 音频质量 | 建议字段 |
详情请参考tipId提示信息说明 |
评测结果展现建议
维度 | 说明 | 详细 |
overall | 单词总分 | 对单词的整体评价 |
pron | 发音得分 | |
details.syllable.score | 音节得分 | 对单词中具体某个音节发音的评价。获取之前要进行非空判断 |
details.stress.score | 单词重读得分 | 对单词中具体某个重读发音的评价。获取之前要进行非空判断 |
details.phone.score | 音素得分 | 对单词中具体某个音素发音的评价。获取之前要进行非空判断 |
details.dp_type | 单词的增漏读 | 表示单词是否重读/漏读(参考对应题型的返回说明) |
details.fake_pron | 伪造发音 | 表示单词是否在词典中,如果不在词典中,会为单词预测发音 |
评测失败时的返回结果
如果返回的评测结果中result结构为空,说明评测失败。
通过返回结果可以获取 errId 和 error,产品端可以根据相应错误码做进一步判断和处理。
错误码
错误码参考:评测错误码