拼音

更新时间:

该文档是开发者在产品功能集成阶段 使用的中文拼音评测题型的技术说明文档

题型描述

  • 支持拼音、声母或韵母,可以指定声调。

  • 反馈总分,流利度得分,每个拼音的得分,每个拼音的声韵母得分,声调得分,以及用户音频地址。

测评请求参数

字段

类型

可选

说明

coreType

String

必选

cn.raw.score表示中文拼音题型

refText

String

必选

评分参考文本, 注:内容全部都是拼音(不指定调时,默认为轻声),支持只传声母或者韵母 ,例如 {"refText":"b p, a o, a1 o1,hao3 hao xue2 xi2 "}

rank

int

可选

评分分制,这个值可以任意设置,最终会根据与100的比例重新计算

precision

double

可选

设置打分精度,0.1、0.5或者1,默认为1

typeThres

int

可选

打分松紧度(分数越高影响越小):1表示严格,2表示宽松,3表示非常严格,4非常宽松,0为默认值(不启用此功能)

attachAudioUrl

int

可选

评测结果中是否返回音频url
0: 不返回
1: 返回

参数示例

{
    "coreType":"cn.raw.score",
    "refText":"guo4 qu4 nai3 nai yi1 ge4 ren2 yao4 zuo4 er4 shi2 lai2 ge4 ren2 de fan4. ",
    "typeThres":1,
    "attachAudioUrl":1
}

返回结果示例

{
    "tokenId": "611f502188bf5b0000070001" ,   //用户请求的唯一标识
    "applicationId": "aXXX",               //授权的Appkey
    "audioUrl": "http:\/\/files.cloud.ssapi.cn:8080\/a148\/11ec01828d53e9a1808aa148v2618ae7",    //用户音频地址
    "connect": {                     //内部参数不需要关注
        "param": {
            "app": {                 //内部参数不需要关注
                "timestamp": "1629442002",
                "applicationId": "a148",
                "sig": "f79bf828f5dfd7ee16a14b1d18a4c3ee5d89a6e4"
            },
            "sdk": {               //内部参数节点不需要关注
                "os": "6.2(9200)1",
                "product": "",
                "source": 7,
                "protocol": 1,
                "os_version": "6.2(9200)",
                "arch": "586",
                "version": 16778752
            }
        },
        "cmd": "connect"
    },
    "params": {
        "app": {               //内部参数节点不需要关注
            "timestamp": "1629442081",
            "userId": "ssound_text",
            "sig": "8f75f190cd1eb11e2556d486f82cc4942429633f",
            "connect_id": "611f4fd288bf5b0000060002",
            "clientId": "",
            "applicationId": "a148"
        },
       "audio": {       //音频参数节点
            "sampleBytes": 2,   //每采样字节数,支持单字节和双字节
            "audioType": "ogg", //音频格式类型
            "sampleRate": 16000, //采样率
            "channel": 1       //单声道,评测仅支持单声道
        },
        "request": {         //请求评分,客户端传入参数
            "typeThres": 1,                     //松紧度,1代表严格
            "tokenId": "611f502188bf5b0000070001",
            "coreType": "cn.raw.score",             //题型类型
            "attachAudioUrl": 1,
            "request_id": "611f502188bf5b0000080001",
            "refText": "guo4 qu4 nai3 nai yi1 ge4 ren2 yao4 zuo4 er4 shi2 lai2 ge4 ren2 de fan4. "   //评测文本
        }
    },
    "recordId": "11ec01828d53e9a1808aa148v2618ae7",
    "refText": "guo4 qu4 nai3 nai yi1 ge4 ren2 yao4 zuo4 er4 shi2 lai2 ge4 ren2 de fan4. ",
    "dtLastResponse": "2021-08-20 14:48:05:405",    //云端响应的时间点
    "cloud_platform": {
        "origin_audio_length": 26691
    },
    "result": {               //评测结果节点
        "overall": 90,          //总分
        "forceout": 0,       //内部参数,无需关注
        "precision": 1,     //评测请求时设置的打分精度,只支持0.1、0.5或者1,默认值为1(如果设置的值不是0.1或0.5则按1处理)
        "systime": 7346,  //评测整个过程的总耗时,单位ms
        "res": "chn.raw.online.1.0",   //评测使用的资源名称
        "delaytime": 52,
        "fluency": {
            "pause": 2,
            "overall": 80,
            "speed": 2
        },
        "tone": 97,       //声调得分
        "pron": 91,         //发音得分,即准确度得分
        "wavetime": 6990,   //音频时长,单位ms
        "accuracy": 91,     //发音得分,即准确度得分
        "phn": 88,            //音素发音得分
        "version": "0.0.80.2021.7.24.00:01:28",   //评测使用的资源版本
       "info": {
            "tipId": 10006,    //音频质量,详情请参考tipId字段说明
            "clip": 0,         //音频声音太高,出现截幅,范围(0~1)。此参数影响评分时,会设置相应的tipId值
            "snr": 2.888726,   //信噪比,值越高越清晰,范围(0~40dB) 此参数影响评分时,会设置相应的tipId值	
            "volume": 84       //录音音量,范围(0~180dB)
        },
        "rank": 100,    //评测请求时设置的总分分制,这个值可以任意设置,最终会根据与100的比例重新计算(不传,默认按100处理)
        "integrity": 100,   //完整度评分
        "pretime": 10,
        "details": [    //句子详情节点
            {
                "tonescore": 100,   //单字声调得分
                "dur": 280,  //单字在音频中的结束时间,单位为毫秒(ms)
                "confidence": [   //置信度,里面的值依次表示这个字对应的声调为:轻声、一声、二声、三声、四声 的概率
                    0,
                    0,
                    0,
                    0,
                    100
                ],
                "char": "guo4",
                "tone": 4,   //单字声调,0~4分别对应轻声、一声、二声、三声,四声
                "start": 400,  //单字在音频中的起始时间,单位为毫秒(ms)
                "score": 96,  //单字发音得分
                "end": 680, //单字发音时间,单位为毫秒(ms)
                "fluency": 100    //流利度评分
            },
            {
                "tonescore": 100, 
                "dur": 360,
                "confidence": [
                    0,
                    0,
                    0,
                    0,
                    100
                ],
                "char": "qu4",
                "tone": 4,
                "start": 680,
                "score": 90,
                "end": 1040,
                "fluency": 83
            },
            {
                "tonescore": 99,
                "dur": 280,
                "confidence": [
                    0,
                    0,
                    2,
                    98,
                    0
                ],
                "char": "nai3",
                "tone": 3,
                "start": 1040,
                "score": 92,
                "end": 1320,
                "fluency": 83
            },
            {
                "tonescore": 98,
                "dur": 400,
                "confidence": [
                    98,
                    0,
                    2,
                    0,
                    0
                ],
                "score": 96,
                "char": "nai",
                "end": 1720,
                "start": 1320,
                "is_pause": 1,
                "tone": 0,
                "fluency": 83
            },
            {
                "tonescore": 56,
                "dur": 240,
                "confidence": [
                    0,
                    16,
                    81,
                    4,
                    0
                ],
                "char": "yi1",
                "tone": 1,
                "start": 2200,
                "score": 59,
                "end": 2440,
                "fluency": 100
            },
            {
                "tonescore": 100,
                "dur": 220,
                "confidence": [
                    0,
                    0,
                    0,
                    0,
                    100
                ],
                "char": "ge4",
                "tone": 4,
                "start": 2440,
                "score": 92,
                "end": 2660,
                "fluency": 100
            },
            {
                "tonescore": 100,
                "dur": 440,
                "confidence": [
                    0,
                    0,
                    100,
                    0,
                    0
                ],
                "score": 96,
                "char": "ren2",
                "end": 3100,
                "start": 2660,
                "is_pause": 1,
                "tone": 2,
                "fluency": 61
            },
            {
                "tonescore": 99,
                "dur": 360,
                "confidence": [
                    0,
                    1,
                    0,
                    0,
                    98
                ],
                "char": "yao4",
                "tone": 4,
                "start": 3460,
                "score": 93,
                "end": 3820,
                "fluency": 67
            },
            {
                "tonescore": 100,
                "dur": 380,
                "confidence": [
                    0,
                    0,
                    0,
                    0,
                    99
                ],
                "char": "zuo4",
                "tone": 4,
                "start": 3820,
                "score": 91,
                "end": 4200,
                "fluency": 89
            },
            {
                "tonescore": 100,
                "dur": 260,
                "confidence": [
                    0,
                    0,
                    0,
                    0,
                    100
                ],
                "char": "er4",
                "tone": 4,
                "start": 4220,
                "score": 99,
                "end": 4480,
                "fluency": 95
            },
            {
                "tonescore": 99,
                "dur": 340,
                "confidence": [
                    0,
                    1,
                    97,
                    1,
                    2
                ],
                "char": "shi2",
                "tone": 2,
                "start": 4480,
                "score": 88,
                "end": 4820,
                "fluency": 87
            },
            {
                "tonescore": 100,
                "dur": 340,
                "confidence": [
                    0,
                    0,
                    100,
                    0,
                    0
                ],
                "char": "lai2",
                "tone": 2,
                "start": 4820,
                "score": 88,
                "end": 5160,
                "fluency": 96
            },
            {
                "tonescore": 100,
                "dur": 280,
                "confidence": [
                    0,
                    0,
                    0,
                    0,
                    100
                ],
                "char": "ge4",
                "tone": 4,
                "start": 5160,
                "score": 85,
                "end": 5440,
                "fluency": 77
            },
            {
                "tonescore": 100,
                "dur": 400,
                "confidence": [
                    0,
                    0,
                    100,
                    0,
                    0
                ],
                "char": "ren2",
                "tone": 2,
                "start": 5440,
                "score": 98,
                "end": 5840,
                "fluency": 65
            },
            {
                "tonescore": 100,
                "dur": 260,
                "confidence": [
                    100,
                    0,
                    0,
                    0,
                    0
                ],
                "char": "de",
                "tone": 0,
                "start": 5840,
                "score": 96,
                "end": 6100,
                "fluency": 100
            },
            {
                "tonescore": 100,
                "dur": 320,
                "confidence": [
                    0,
                    0,
                    0,
                    0,
                    100
                ],
                "char": "fan4",
                "tone": 4,
                "start": 6100,
                "score": 92,
                "end": 6420,
                "fluency": 84
            }
        ]
    },
    "eof": 1
}

返回结果说明

类型

说明

使用建议

tokenId

string

用户请求的唯一标识

可供参考

applicationId

string

授权账号,即用户的Appkey

内部参数

audioUrl

string

用户音频下载地址:
音频默认保留20天左右,如需长久保存,建议产品方下载至自己的服务器。
域名会因不同访问区域而不同,以实际返回为准。

recordId

string

音频文件的唯一标识

refText

string

传入的评测文本

dtLastResponse

string

云端响应的时间点

内部参数

eof

int

内部参数

params

object

回显客户端传入的评测请求参数

- app

object

- - applicationId

string

授权账号

- - userId

string

产品端的用户标识,可以是自定义的自符串,建议一个用户一个userid,方便排查问题

- - timestamp

string

start时间

- - sig

string

校验码

- request

object

- - coreType

string

使用引擎

- - tokenId

string

用户请求的唯一标识

- - refText

string

评分参考文本

- - rank

int

评分分制

- - precision

float

打分精度

- - attachAudioUrl

int

评分结果中是否包含音频url

- audio

object

- - sampleRate

int

采样率

- - channel

int

声道

- - sampleBytes

int

每采样字节数,支持单字节和双字节

- - audioType

string

音频格式

result

object

评测结果

- overall

float

总分

内部参数

- precision

float

评分精度

内部参数

- systime

int

评测整个过程的总耗时,单位ms

- res

string

评测本题型时,使用的资源名称

内部参数

-fluency

object

流利度情况

- -pause

int

是否停顿

- -overall

float

流利度分

- -speed

int

语速快慢,0:慢,1:正常,2:快

-tone

float

声调得分

保留备用

- accuracy

float

发音得分(同pron字段)

- phn

float

音素发音得分

-version

string

引擎的版本,包含发布时间

- rank

int

评分分制

- integrity

float

完整度评分

建议字段

- pretime

int

云端调用Start接口本身耗时,单位ms

- pron

float

发音分

内部参数

-overall

float

总分

建议字段

-delaytime

int

云端从feed音频结束到获取结果的耗时,单位ms

内部参数

-wavetime

int

音频时长

可供参考

- info

object

- - snr

float

信噪比

可供参考

- - clip

float

音频声音太高,出现截幅,范围(0\~1)。 此参数影响评分时,会设置相应的tipId

内部参数

- - tipId

int

音频质量

建议字段

- volume

int

如开启vad功能,返回此参数,表示录音的音量值

可供参考

- details

array

拼音详情

建议字段

- - fluency

float

流利度评分

保留备用

- - dur

int

发音时间

可供参考

- - tone

int

单个拼音或声韵母声调

0~4分别对应轻声、一声、二声、三声、四声

- - tonescore

int

单个拼音或声韵母声调得分

- - score

float

单个拼音或声韵母得分

- - char

string

单个拼音或声韵母

- - confidence

array

置信度

里面的值依次表示这个字对应的声调为:轻声、一声、二声、三声、四声 的概率。

- - end

int

单个拼音或声韵母发音时间,单位为毫秒(ms)

- - start

int

单个拼音或声韵母在音频中的起始时间,单位为毫秒(ms)

返回结果说明

维度

说明

详细

overall

总分

整体评分

pron

发音分

fluency. overall

流利度总分

details.tonescore

单个声调得分

单个拼音或声韵母声调得分

details.score

单个得分

单个拼音或声韵母得分

评测失败时的返回结果

  • 如果返回的评测结果中result结构为空,说明评测失败。

  • 通过返回结果可以获取 errId 和 error,产品端可以根据相应错误码做续判断和处理。

错误码