自然拼读

更新时间:

该文档是开发者在产品功能集成阶段 使用的自然拼读题型的语音评测技术文档

题型描述

  • 对英文自然拼读发音进行打分,支持音标检错功能。

  • 分别反馈音标,单词的得分。

评测请求参数

字段

类型

可选

说明

coreType

String

必选

en.nsp.score表示自然拼读评测

refText

String

必选

评分参考文本有两种 :
1、{"refText":"a(z:ae) a(z:ae) ant"}音标按内部音标规范
2、{"refText":"a(p:æ) a(p:æ) ant"}. 按原始音标指定发音(如果原始音标对应多种标准,处理优先级:IP88 > KK > IP66)
文本符号说明

attachAudioUrl

int

可选

评测结果中是否返回音频url
0: 不返回 1: 返回

rank

int

可选

评分分制,这个值可以任意设置,最终会根据与100的比例重新计算

phdet

int

可选

音素检错,1表示使用此功能,默认为0,不启动; 只能设置01

accent

string

可选

"accent":"en" 表示指定英式发音评测
"accent":"am" 表示指定美式发音评测
不设置该参数时引擎根据发音情况智能返回英/美式发音

参数示例

测评参数示例如下:

{
    "coreType":"en.nsp.score",
    "refText":"a(z:ae) a(z:ae) ant",
    "rank":100,
    "phdet":1,
    "attachAudioUrl": 1
}

返回结果示例

{
    "tokenId": "61264be788bf5b0000070001",
    "applicationId": "a148",
    "dtLastResponse": "2021-08-25 21:55:51:11",
    "connect": {
        "param": {
            "app": {
                "timestamp": "1629899603",
                "applicationId": "a148",
                "sig": "3ff6f9eda22673ac320a1976d45e6538d9fb8cec"
            },
            "sdk": {
                "os": "6.2(9200)1",
                "product": "",
                "source": 7,
                "protocol": 1,
                "os_version": "6.2(9200)",
                "arch": "586",
                "version": 16778752
            }
        },
        "cmd": "connect"
    },
    "params": {
        "app": {
            "timestamp": "1629899751",
            "userId": "ssound_text",
            "sig": "b3181b14371395759adbb6a056d465ada6969805",
            "connect_id": "61264b5388bf5b0000060002",
            "clientId": "",
            "applicationId": "a148"
        },
        "audio": {
            "sampleBytes": 2,
            "audioType": "ogg",
            "sampleRate": 16000,
            "channel": 1
        },
        "request": {
            "request_id": "61264be788bf5b0000080001",
            "tokenId": "61264be788bf5b0000070001",
            "coreType": "en.nsp.score",
            "refText": "a(z:ae) a(z:ae) ant"
        }
    },
    "recordId": "11ec05ac25efcaf2b1c6a148u2619eed",
    "refText": "a(z:ae) a(z:ae) ant",
    "result": {
        "pron": 70,
        "forceout": 0,
        "precision": 1,
        "systime": 2458,
        "res": "eng.nsp.online.0.2",
        "version": "0.0.80.2021.7.24.00:01:28",
        "info": {
            "tipId": 0,
            "clip": 0,
            "snr": 30.972075,
            "volume": 81
        },
        "rank": 100,
        "delaytime": 16,
        "wavetime": 1990,
        "details": [
            {
                "stress": [
                    {
                        "ref": 0,
                        "score": 1,
                        "char": "ae"
                    }
                ],
                "accent": "ea",
                "char": "a",
                "dur": 360,
                "score": 83,
                "phone": [
                    {
                        "char": "ae",
                        "score": 83,
                        "end": 880,
                        "start": 520
                    }
                ],
                "end": 880,
                "start": 520
            },
            {
                "stress": [
                    {
                        "ref": 0,
                        "score": 1,
                        "char": "ae"
                    }
                ],
                "accent": "ea",
                "char": "a",
                "dur": 310,
                "score": 81,
                "phone": [
                    {
                        "char": "ae",
                        "score": 81,
                        "end": 1470,
                        "start": 1160
                    }
                ],
                "end": 1470,
                "start": 1160
            },
            {
                "stress": [
                    {
                        "ref": 0,
                        "score": 1,
                        "char": "ae_n_t"
                    }
                ],
                "accent": "ea",
                "char": "ant",
                "dur": 290,
                "score": 45,
                "phone": [
                    {
                        "char": "ae",
                        "score": 83,
                        "end": 1830,
                        "start": 1640
                    },
                    {
                        "char": "n",
                        "score": 79,
                        "end": 1900,
                        "start": 1830
                    },
                    {
                        "char": "t",
                        "score": 10,
                        "end": 1930,
                        "start": 1900
                    }
                ],
                "end": 1930,
                "start": 1640
            }
        ],
        "pretime": 1,
        "overall": 70
    },
    "eof": 1,
    "cloud_platform": {
        "origin_audio_length": 7807
    }
}

返回结果说明

类型

说明

使用建议

recordId

string

音频文件的唯一标识

可供参考

tokenId

string

用户请求的唯一标识

可供参考

applicationId

string

授权账号,提供的评测Appkey

内部参数

dtLastResponse

string

云端响应的时间点

内部参数

eof

int

0表示返回未结束,后续还有其它的返回结果 1:表示本次评测所有的返回结束

内部参数

refText

string

传入的评测文本

可供参考

params

object

回显客户端传入的评测请求参数

- app

object

- - applicationId

string

授权账号,提供的评测Appkey

- - userId

string

用户标识

- - timestamp

string

start时间

- - sig

string

校验码

- request

object

请求评分的参数设置节点

- audio

object

请求评分的音频参数设置节点

result

object

评测结果

- version

string

引擎的版本,包含发布时间

内部参数

- rank

int

评分分制

内部参数

- precision

float

评分精度

内部参数

- res

string

评测本题型时,使用的资源名称

内部参数

- forceout

int

内部参数

- pretime

int

云端调用Start接口本身耗时,单位ms

内部参数

- systime

int

评测整个过程的总耗时,单位ms

内部参数

- delaytime

int

云端从feed音频结束到获取结果的耗时,单位ms

内部参数

- wavetime

int

音频时长,单位ms

可供参考

- overall

float

总分

建议字段

- pron

float

发音分

内部参数

- details

array

- - accent

string

请求参数中配置accent时不返回此字段,否则返回此字段"accent":"ea"

- - dur

int

单词发音时间,单位ms

可供参考

- - char

string

规整后的单词文本

可供参考

- - score

int

单词得分

可供参考

- - dp_type

int

单词正常朗读(不输出dp_ type字段)、漏读(1)、重复读(2)

- - start

int

单词在音频中的起始时间,单位为毫秒(ms)

可供参考

- - end

int

单词在音频中的结束时间,单位为毫秒(ms)

可供参考

- - stress

array

重音发音

- - - char

string

音素

可供参考

- - - ref

int

标识当前音节是否需要重读
1表示需要重读,0不需要重读

- - - score

int

重音得分(0、1)

- - phone

array

音素级评分结果,详情请参考音素对照表

- - - char

string

音素(当请求参数中设置accent时此字段为标准的英美式音素,否则为内部映射音素)

可供参考

- - - score

int

音素得分(0-100)

可供参考

- - - phid

int

音素在单词音标中的位置

只有设置phdet才输出此字段

- - - pherr

int

检测音素是否有错(0、1)

只有设置phdet才输出此字段

- - - ph2alpha

string

当前音素对应的单词中的字母

只有设置phdet才输出此字段

- info

object

- - snr

float

信噪比,值越高越清晰,范围(0~40dB) 此参数影响评分时,会设置相应的tipId

可供参考

- - clip

float

音频声音太高,出现截幅,范围(0\~1)。 此参数影响评分时,会设置相应的tipId

内部参数

- - volume

int

录音音量,范围(0~180dB)

可供参考

- - tipId

int

音频质量
详情请参考tipId提示信息说明

建议字段

评测结果建议展现维度

维度

说明

详细

overall

总分

题型的评测得分

评测失败时的返回结果

  • 如果返回的评测结果中result结构为空,说明评测失败。

  • 通过返回结果可以获取 errId 和 error,产品端可以根据相应错误码做续判断和处理。

错误码