音标

更新时间:

该文档是开发者在产品功能集成阶段 使用的音标跟读题型的语音评测技术文档

题型描述

  • 对英文音标进行打分,反馈维度包含音标总分、发音得分及对应音素得分情况。

测评请求参数

字段

类型

可选

说明

coreType

String

必选

en.alpha.score表示英文音标评测

refText

String

必选

评分参考文本,仅支持音标,如需评测多个音标,需用空格隔开
具体参考音素对照表

rank

int

可选

评分分制,这个值可以任意设置,最终会根据与100的比例重新计算

precision

double

可选

设置打分精度,只支持0.1、0.5或者1,默认值为1(如果设置的值不是0.10.5则按1处理)

参数示例

{
    "coreType": "en.alpha.score",
    "refText": "ih",
    "rank": 100,
    "precision": 0.1
}

返回结果示例

{
  “applicationId”: “aXXX”,            //授权的Appkey
    "tokenId": "5a4edc47000df30000090004",  //用户请求的唯一标识
    "recordId": "5a4edc9d28c338dabd000008",    //音频文件的唯一标识
    "dtLastResponse": "2021-08-09 10:02:08:609",     //云端响应的时间点
    "result": {                       //评测结果节点
        "forceout": 0,
        "pron": 97.3,    //发音得分,即准确度得分
        "version": "0.0.80.2018.1.3.11:10:55",   //评测使用的资源版本
        "rank": 100,
        "pretime": 2,
        "delaytime": 51,   //云端从feed音频结束到获取结果的耗时,单位ms
        "overall": 97.3,   //总分
       "info": {
            "tipId": 10006,    //音频质量,详情请参考tipId字段说明
            "clip": 0,         //音频声音太高,出现截幅,范围(0~1)。此参数影响评分时,会设置相应的tipId值
            "snr": 2.888726,   //信噪比,值越高越清晰,范围(0~40dB) 此参数影响评分时,会设置相应的tipId值	
            "volume": 84       //录音音量,范围(0~180dB)
        },
        "wavetime": 1990,     //音频时长,单位ms
        "systime": 2774,
        "details": [              //音素节点反馈
            {
                "dur": 330,     //单词发音时间,单位ms
                "phone": [     //音素级评分结果,返回的是内部音素,详情请参考音素对照表
                    {
                        "char": "ih",
                        "score": 97    //发音得分
                    }
                ],
                "char": "ih",        //内部音素
                "end": 1030,     //该音素发音结束时间,单位ms
                "start": 700,      //该音素发音开始时间,单位ms
                "score": 97       //音素得分
            }
        ],
        "precision": 0.1,           //评测请求时设置的打分精度,只支持0.1、0.5或者1,默认值为1(如果设置的值不是0.1或0.5则按1处理)
        "res": "eng.alpha.online.0.1"     //评测使用的资源名称
    },
    "eof": 1,
    "params": {
        "app": {            //内部参数节点不需要关注
            "timestamp": "1515117639",
            "sig": "76f93b03334e890f7fcd683e02b5c8c619d87e97",
            “applicationId”: “aXXX”,
            "userId": "ssound_text",
            "clientId": ""
        },
        "request": {
            "coreType": "en.alpha.score",
            "tokenId": "5a4edc47000df30000090004",
            "refText": "ih",
            "precision": 0.1,
            "rank": 100
        },
        "audio": {           //音频参数节点
            "sampleRate": 16000,     //采样率
            "channel": 1,                  //单声道,评测仅支持单声道
            "sampleBytes": 2,           //每采样字节数,支持单字节和双字节
            "audioType": "ogg"      //音频格式类型
        }
    },
    "refText": "ih"
}

返回结果说明

类型

说明

使用建议

recordId

string

音频文件的唯一标识

可供参考

tokenId

string

用户请求的唯一标识

可供参考

applicationId

string

授权账号,提供的评测Appkey

内部参数

dtLastResponse

string

云端响应的时间点

内部参数

eof

int

0表示返回未结束,后续还有其它的返回结果 1:表示本次评测所有的返回结束s

内部参数

refText

string

传入的评测文本

可供参考

params

object

回显客户端传入的评测请求参数

- app

object

- - applicationId

string

授权账号,提供的评测Appkey

- - userId

string

用户标识

- - timestamp

string

start时间

- - sig

string

校验码

- request

object

评分请求参数节点

- audio

object

评分请求的音频参数节点

result

object

评测结果

- version

string

引擎的版本,包含发布时间

内部参数

- rank

int

评分分制

内部参数

- precision

float

评分精度

内部参数

- res

string

评测本题型时,使用的资源名称

内部参数

- forceout

int

内部参数

- pretime

int

云端调用Start接口本身耗时,单位ms

内部参数

- systime

int

评测整个过程的总耗时,单位ms

内部参数

- delaytime

int

云端从feed音频结束到获取结果的耗时,单位ms

内部参数

- wavetime

int

音频时长,单位ms

可供参考

- overall

float

总分

建议字段

- pron

float

发音分

内部参数

- details

array

- - start

int

音标在音频中的起始时间,单位ms

可供参考

- - end

int

音标在音频中的结束时间,单位ms

可供参考

- - dur

int

音标发音时间,单位ms

可供参考

- - char

string

规整后的音标文本

可供参考

- - score

int

音标得分

可供参考

- - phone

array

音素级评分结果节点
详情请参考音素对照表

- - - char

string

音素

可供参考

- - - score

int

音素得分(0-100)

可供参考

- info

object

- - snr

float

信噪比,值越高越清晰,范围(0~40dB) 此参数影响评分时,会设置相应的tipId

可供参考

- - clip

float

音频声音太高,出现截幅,范围(0\~1)。 此参数影响评分时,会设置相应的tipId

内部参数

- - volume

int

录音音量,范围(0~180dB)

可供参考

- - tipId

int

音频质量,请参考 tipId提示信息说明

建议字段

评测结果展现建议

维度

说明

详细

overall

总分

对整体音标发音情况进行总体评分

pron

发音得分

对整体音标发音进行评分

detials[i].score

得分

对每个音标的发音评分。获取之前要进行非空判断

details[i] phone[i].score

得分

对每个音素的发音评分

评测失败时的返回结果

  • 如果返回的评测结果中result结构为空,说明评测失败。

  • 通过返回结果可以获取 errId 和 error,产品端可以根据相应错误码做续判断和处理。

错误码