儿童单词

更新时间:

该文档是开发者在产品功能集成阶段 使用的单词跟读题型的语音评测技术,适用于12岁以下儿童单词跟读评测功能

题型描述

  • 对英文单词、词组进行打分。

  • 支持自定义发音进行评分;支持音节重音检测;支持英美式发音区分;

  • 反馈维度包含单词总分,重音判断,音素得分。

评测请求参数

字段

类型

可选

说明

coreType

string

必选

en.word_kid.score表示英文幼儿单词评测

refText

string

必选

评分参考文本, 注:外部指定发音支持以下两种方式:
1、directory(z:d ih - 'r eh k - tr ih) 音标按引擎内部音标规范
2、directory(p:dəˈrektəri) 按原始音标指定发音(如果原始音标对应多种标准,处理优先级:IP88 > KK > IP66)文本符号说明

rank

int

可选

评分分制,这个值可以任意设置,最终会根据与100的比例重新计算

precision

double

可选

设置打分精度,只支持0.1、0.5或者1,默认值为1(如果设置的值不是0.10.5则按1处理)

attachAudioUrl

int

可选

评测结果中是否返回音频url
0: 不返回
1: 返回

typeThres

int

可选

打分松紧度(分数越高影响越小):1表示严格,2表示宽松,3表示非常严格,4非常宽松,0为默认值(不启用此功能)

accent

string

可选

指定英,美式评分。默认不启用此功能,引擎根据用户发音情况智能判别英美式发音。
设置"accent":"en" 表示指定英式发音评测
"accent":"am" 表示指定美式发音评测

参数示例

{
    "coreType":"en.word_kid.score",
    "refText":"egg",
    "rank":100,
    "attachAudioUrl":1,
    "accent":"en"
}

返回结果示例

{
    "tokenId": "6114e85388bf5b00000a0001",
    "applicationId": "aXXX",            //  提供的appkey
    "audioUrl": "http:\/\/files.cloud.ssapi.cn:8080\/a148\/11ebfb4ecda877958771a148m2611197",  //用户音频下载地址
    "connect": {   //内部参数,无需关注
        "param": {
            "app": {
                "timestamp": "1628760147",
                "applicationId": "aXXX",
                "sig": "5f82347d335449cc9aa053a4f2f29820f54bbd2f"
            },
            "sdk": {
                "os": "6.2(9200)1",
                "product": "",
                "source": 7,
                "protocol": 1,
                "os_version": "6.2(9200)",
                "arch": "586",
                "version": 16778752
            }
        },
        "cmd": "connect"
    },
    "params": {
        "app": {
            "timestamp": "1628760147",
            "userId": "ssound_text",
            "sig": "5f82347d335449cc9aa053a4f2f29820f54bbd2f",
            "connect_id": "6114e85388bf5b00000c0002",
            "clientId": "",
            "applicationId": "a148"
        },
        "audio":{                    //请求评分的音频格式参数
            "sampleRate":16000,  //采样率
            "channel":1,    //声道,1是单声道,2是双声道。评测仅支持单声道
            "sampleBytes":2,
            "audioType":"ogg"  //音频类型
        },
        "request": {        //请求评分的参数节点
            "request_id": "6114e85388bf5b00000b0001",
            "accent": "en",    //请求参数中配置accent时不返回此字段,否则返回此字段"accent"
            "rank": 100,                 //分制,默认是100表示百分制,这个值可以任意设置,最终会根据与100的比例重新计算
            "attachAudioUrl": 1,            //评测结果中是否返回音频url ; 0: 不返回 ; 1: 返回
            "tokenId": "6114e85388bf5b00000a0001",
            "refText": "egg",                       //文本内容
            "coreType": "en.word_kid.score"    //题型类型
        }
    },
    "recordId": "11ebfb4ecda877958771a148m2611197", //数据在云端的唯一标识,请保存到产品数据库,方便排查问题
    "refText": "egg",                              //文本内容
    "dtLastResponse": "2021-08-12 17:22:27:884",         //返回数据时间
    "cloud_platform": {
        "origin_audio_length": 7807
    },
    "result": {
        "pron": 98,
        "forceout": 0,
        "precision": 1,
        "systime": 2104,
        "res": "eng.wrd_kid.online.0.2",
        "version": "0.0.80.2021.7.24.00:01:28",
        "info": {
            "tipId": 10004,
            "clip": 0,
            "snr": 30.070004,
            "volume": 77
        },
        "rank": 100,
        "delaytime": 20,             //云端从feed音频结束到获取结果的耗时,单位ms
        "wavetime": 1990,          //音频文件时长
        "details": [
            {
                "stress": [
                    {
                        "ref": 0,
                        "score": 1,
                        "char": "eh_g"
                    }
                ],
                "char": "egg",
                "dur": 520,         //单词发音时间,单位ms
                "score": 98,       //发音得分
                "phone": [        //单词的音素组合
                    {
                        "char": "e",      //这里返回的是的音素,不是国际音素,如果产品需要使用,需要转换成国际音素
                        "score": 96,     //音素得分
                        "end": 1460,
                        "start": 1220
                    },
                    {
                        "char": "g",
                        "score": 100,
                        "end": 1740,
                        "start": 1460
                    }
                ],
                "end": 1740,
                "start": 1220
            }
        ],
        "pretime": 23,   //云端调用Start接口本身耗时,单位ms
        "overall": 98
    },
    "eof": 1
}

返回结果说明

类型

说明

使用建议

recordId

string

音频文件的唯一标识

可供参考

audioUrl

string

用户音频下载地址:
音频默认保留20天左右,如需长久保存,建议产品方下载至自己的服务器。
域名会因不同访问区域而不同,以实际返回为准。

可供参考

tokenId

string

用户请求的唯一标识

可供参考

applicationId

string

授权账号,提供的评测Appkey

内部参数

dtLastResponse

string

云端响应的时间点

内部参数

eof

int

0表示返回未结束,后续还有其它的返回结果 1:表示本次评测所有的返回结束

内部参数

refText

string

传入的评测文本

可供参考

params

object

回显客户端传入的评测请求参数

- app

object

- - applicationId

string

授权账号,即用户的Appkey

- - userId

string

用户标识

- - timestamp

string

start时间

- - sig

string

校验码

- request

object

请求评分的参数设置节点

- audio

object

请求评分的音频参数设置节点

result

object

评测结果节点

- version

string

引擎的版本,包含发布时间

内部参数

- rank

int

评分分制

内部参数

- precision

float

评分精度

内部参数

- res

string

评测本题型时,使用的资源名称

内部参数

- forceout

int

内部参数

- pretime

int

云端调用Start接口本身耗时,单位ms

内部参数

- systime

int

评测整个过程的总耗时,单位ms

内部参数

- delaytime

int

云端从feed音频结束到获取结果的耗时,单位ms

内部参数

- wavetime

int

音频时长,单位ms

可供参考

- overall

float

总分

建议字段

- pron

float

发音分

内部参数

- details

array

- - start

int

单词在音频中的起始时间,单位ms

可供参考

- - end

int

单词在音频中的结束时间,单位ms

可供参考

- - dur

int

单词发音时间,单位ms

可供参考

- - char

string

规整后的单词文本

可供参考

- - score

int

单词得分

可供参考

- - fake_pron

int

单词不在词典(集外词),才会输出此字段。如果需要对集外词进行评测,可以通过refText传音标的方式进行评测。

- - dp_type

int

单词正常朗读(不输出dp_ type字段)、漏读(1)、重复读(2)
正常:该字段不输出;单词漏读时, dptype:1;重读时,dp type:2。

- - accent

string

请求参数中配置accent时不返回此字段,否则返回此字段"accent":"ea"

- - stress

array

重音发音

- - - char

string

音素

可供参考

- - - ref

int

标识当前音节是否需要重读.
1表示需要重读,0不需要重读

- - - score

int

重音反馈(0、1)

- - phone

array

音素级评分结果 ,详情请参考音素对照表

- - - char

string

音素(当请求参数中设置accent时此字段为标准的英美式音素,否则为内部映射音素)

可供参考

- - - score

int

音素得分(0-100)

可供参考

- - - phid

int

音素在单词音标中的位置

只有设置phdet才输出此字段

- - - pherr

int

检测音素是否有错(0、1)

只有设置phdet才输出此字段

- - - ph2alpha

string

音素对应的字母

只有设置phdet才输出此字段

- realtime_details

array

实时反馈信息

-- char

string

单词

供参考

-- dp_type

int

0:表示正常读 1:表示漏读或者未读 2:表示重读

供参考

- info

object

- - snr

float

信噪比,值越高越清晰,范围(0~40dB) 此参数影响评分时,会设置相应的tipId

可供参考

- - clip

float

音频声音太高,出现截幅,范围(0\~1)。 此参数影响评分时,会设置相应的tipId

内部参数

- - volume

int

录音音量,范围(0~180dB)

可供参考

- - tipId

int

音频质量

建议字段

详情请参考tipId提示信息说明

评测结果展现建议

维度

说明

详细

overall

单词总分

对单词的整体评价

pron

发音得分

details.syllable.score

音节得分

对单词中具体某个音节发音的评价。获取之前要进行非空判断

details.stress.score

单词重读得分

对单词中具体某个重读发音的评价。获取之前要进行非空判断

details.phone.score

音素得分

对单词中具体某个音素发音的评价。获取之前要进行非空判断

details.dp_type

单词的增漏读

表示单词是否重读/漏读(参考对应题型的返回说明)

details.fake_pron

伪造发音

表示单词是否在词典中,如果不在词典中,会为单词预测发音

评测失败时的返回结果

  • 如果返回的评测结果中result结构为空,说明评测失败。

  • 通过返回结果可以获取 errId 和 error,产品端可以根据相应错误码做进一步判断和处理。

错误码