MSML标签语言

更新时间:
复制为 MD 格式

通过Model Speech Synthesis Markup Language(MSML)标签语言可以控制TTS如何发音,包括控制断句分词方式、停顿和声调等特征,甚至可以实现插入音频等功能。本文为您介绍MSML标签语言的相关内容。

概述

MSML标签分为输入标签和输出标签。

  • 输出标签:指大模型传给通信引擎所使用的标签,需用户按照自身需求进行配置。

  • 输入标签:指通信引擎传给大模型所使用的标签。

说明
  • 目前仅中文及英文声音支持MSML功能,中文和英文所支持的MSML标签及内容也有略有差别,详情请参考TTS输出标签

  • 所有文本需放在<speak></speak>标签之内,且每个语音合成任务只能包含一个<speak></speak>标签。

  • 标签内的文字内容如果包含XML的特殊字符,需要做字符转义,常用的特殊字符对应关系如下。

    • "(双引号):&quot;

    • ' (撇号或单引号):&apos;

    • &(表示和的符号):&amp;

    • <(小于号):&lt;

    • >(大于号):&gt;

注意事项

  • 由于大模型语音合成场景主要是流式场景,所以大部分跨过大文本区间的MSML的较难完整进行流式输出,容易造成等待卡顿。

  • 实时语音场景下的语音合成由于是流式场景,需要保障在一句话整体标签闭合完整。

TTS输出标签

根标签-speak标签

  • 描述

    所有支持MSML标签的根节点。一切需要调用MSML标签的文本都要包含在<speak></speak>中。

  • 语法
    <speak>需要调用MSML标签的文本</speak>
  • 标签关系

    <speak>标签可以包含文本和以下标签,详情请参见子标签

    • <break>

    • <phoneme>

    • <say-as>

    • <sub>

    • <audio>

  • 示例
    <speak>
      需要调用MSML标签的文本。
    </speak>
  • 音频效果

子标签

break标签

  • 描述

    用于在文本中插入停顿,该标签是可选标签。

  • 语法
    # 空属性
     <break/>
     # 带time属性
     <break time="string"/>
  • 属性

    属性名称

    属性类型

    属性值

    是否必选

    描述

    time

    String

    [number]s/[number]ms

    以秒/毫秒为单位设置停顿的时长 (如“2s”、“50ms”)。

    • [number]s:以秒为单位,[number]取值范围为[1, 10]的整数。

    • [number]ms:以毫秒为单位,[number]取值范围为[50, 10000]的整数。

    重要:连续出现多个<break>标签时,停顿时长为各标签停顿时长之和,若总时长超过10秒,则只生效10秒。

    例如,在以下示例中,连续3<break>标签的总停顿时长为15秒,但由于超过10秒,最终有效停顿时长为10秒。

    <speak>
       请闭上眼睛休息一下<break time="5s"/><break time="5s"/><break time="5s"/>好了,请睁开眼睛。
     </speak>
  • 标签关系

    <break>是空标签,不能包含任何标签。如果MSML结构中存在<s>标签,请把<break>写在<s>里面,表示对当前段落或句子设置停顿。

  • 示例
    <speak>
       请闭上眼睛休息一下<break time="500ms"/>好了,请睁开眼睛。
     </speak>
  • 音频效果

say-as标签

  • 描述

    用于指示出标签内文本的信息类型,进而按照该类型的默认发音方式发音。

  • 语法
    <say-as interpret-as="string">文本</say-as>
  • 属性

    属性名称

    属性类型

    属性值

    是否必选

    描述

    interpret-as

    String

    cardinal/digits/telephone/characters/date/time/

    指示出标签内文本的信息类型:

    • cardinal:按整数或小数发音

    • digits:按数字发音。

    • telephone:按电话号码常用方式发音。

    • characters:将标签内的文本按字符一一读出。

    • date:按日期发音。

    • time:按时间发音。

  • <say-as>类型支持范围

    支持范围详情

    基数(cardinal)

    • 中文格式:

      格式

      示例

      中文输出

      说明

      数字串

      145

      一百四十五

      整数输入范围:20位以内的正负整数,[-99999999999999999999,99999999999999999999]。

      小数输入范围:对小数点后小数的位数没有特殊限制,建议不超过10位。

      负号+数字串

      -145

      负一百四十五

      以逗号分隔3位数字串

      10,000

      一万

      负号+以逗号分隔3位数字串

      -10,124

      负一万一百二十四

      数字串+小数点+2个零

      10.00

      负号+数字串+小数点+2个零

      -110.00

      负一百一十

      数字串+小数点+数字串

      79.090

      七十九点零九零

      负号+数字串+小数点+数字串

      -79.001

      负七十九点零零一

    • 英文格式:

      格式

      示例

      英文输出

      说明

      数字串

      145

      one hundred forty five

      整数输入范围:13位以内的正负整数,[-999999999999,999999999999]。

      小数输入范围:对小数点后小数的位数没有特殊限制,建议不超过10位。

      以零开头的数字串

      0145

      one hundred forty five

      负号+数字串

      -145

      minus hundred forty five

      以逗号分隔三位数字串

      60,000

      sixty thousand

      负号+以逗号分隔三位数字串

      -208,000

      minus two hundred eight thousand

      数字串+小数点+零

      12.00

      twelve

      数字串+小数点+数字串

      12.34

      twelve point three four

      以逗号分隔三位数字串+小数点+数字串

      1,000.1

      one thousand point one

      负号+数字串+小数点+数字串

      -12.34

      minus twelve point three four

      负号+以逗号分隔三位数字串+小数点+数字串

      -1,000.1

      minus one thousand point one

      (以逗号分隔三位)数字串+连词符+(以逗号分隔三位)数字

      1-1,000

      one to one thousand

      其他默认读法

      012.34

      twelve point three four

      -

      1/2

      one half

      -3/4

      minus three quarters

      5.1/6

      five point one over six

      -3 1/2

      minus three and a half

      1,000.3^3

      one thousand point three to the power of three

      3e9.1

      three times ten to the power of nine point one

      23.10%

      twenty three point one percent

    数字(digits)

    • 中文格式:

      格式

      示例

      中文输出

      说明

      数字串

      129090909

      一二九零九零九零九

      对数字串的长度没有特殊限制,建议不超过20位。

      当数字串超过10位时,每个数字后插入停顿。

    • 英文格式:

      格式

      示例

      英文输出

      说明

      数字串

      12034

      one two zero three four

      对数字串的长度没有特殊限制,建议不超过20位。

      当数字串以空格或连词符分组时,分组之间会插入逗号而产生适当停顿,支持最长5个分组。

      数字串+空格或连词符+数字串+空格或连词符+数字串+空格或连词符+数字串

      1-23-456 7890

      one, two three, four five six, seven eight nine zero

    电话(telephone)

    • 中文格式:

      格式

      示例

      中文输出

      说明

      座机号

      49302**

      四九三 零二**

      支持7~8位座机号,支持空格和“-”作为分隔符。

      其中,7位座机号支持“3-4”的数字分隔方式;8位座机号支持“4-4”的数字分隔方式。

      493 02**

      四九三 零二**

      493-02**

      四九三 零二**

      625525**

      六二五五 二五**

      6255 25**

      六二五五 二五**

      6255-25**

      六二五五 二五**

      座机号+分机号

      49302**-109

      四九三 零二** 转幺零九

      支持1~4位分机号。

      49302**转109

      四九三 零二** 转幺零九

      49302**分机109

      四九三 零二** 分机幺零九

      49302**分机号109

      四九三 零二** 分机号幺零九

      区号+座机号

      010625525**

      零幺零 六二五五 二五**

      支持区号:010、02x、03xx、04xx、05xx、07xx、08xx、09xx。

      010 625525**

      零幺零 六二五五 二五**

      010 6255 25**

      零幺零 六二五五 二五**

      010 6255-25**

      零幺零 六二五五 二五**

      010-625525**

      零幺零 六二五五 二五**

      010-6255-25**

      零幺零 六二五五 二五**

      (010)625525**

      零幺零 六二五五 二五**

      031989070**

      零三幺九 八九零 七零**

      0319-89070**

      三幺九 八九零 七零**

      区号+座机号+分机号

      010 625525**-109

      零幺零 六二五五 二五** 转幺零九

      -

      010-625525**-109

      零幺零 六二五五 二五** 转幺零九

      (010)625525**-109

      零幺零 六二五五 二五** 转幺零九

      (010)625525**转109

      零幺零 六二五五 二五** 转幺零九

      (010)625525**分机109

      零幺零 六二五五 二五** 分机幺零九

      (010)625525**分机号109

      零幺零 六二五五 二五** 分机号幺零九

      国家代码+区号+座机号

      86-010-627916**

      八六 零幺零 六二七九 幺六**

      支持国家代码:86、 (86)、+86、(+86)、0086。并统一读为“八六”。

      (86)10-627916**

      八六 幺零 六二七九 幺六**

      +86-010-627916**

      八六 零幺零 六二七九 幺六**

      0086-10-627916**

      八六 幺零 六二七九 幺六**

      (+86)-10-6279 16**

      八六 幺零 六二七九 幺六**

      国家代码+区号+座机号+分机号

      (86)21-58118818-2**

      八六 二幺 五八幺幺 八八幺八 转二**

      -

      (86)021-5811-8818-2**

      八六 零二幺 五八幺幺 八八幺八 转二**

      (86)021-581188**转207

      八六 零二幺 五八幺幺 八八** 转二零七

      (86)21-5811-88**分机207

      八六 二幺 五八幺幺 八八** 分机二零七

      +86-021-581188**分机号207

      八六 零二幺 五八幺幺 八八**分机号二零七

      手机号

      139 **** 5678

      幺三九 **** 五六七八

      支持11位手机号,支持3-3-5、3-4-4两种数字分隔方式

      139-***-05678

      幺三九 *** 零五六七八

      139 *** 05678

      幺三九 *** 零五六七八

      国家代码+手机号

      +86-139****5678

      八六 幺三九 **** 五六七八

      -

      (+86)-139-****-5678

      八六 幺三九 **** 五六七八

      +86139****5678

      八六 幺三九 **** 五六七八

      0086-139 *** 05678

      八六 幺三九 *** 零五六七八

      服务号

      123

      幺二三

      • 支持常用的服务号。

      • 支持以400/800开头的10位服务号,支持以“3-3-4”的数字分隔方式。

      • 支持以12530/17951/12593开头的16位号码。

      956**

      九五六**

      40081105**

      四零零 八幺幺 零五**

      800-810-****

      八零零 八幺零 ****

      125301352063****

      幺二五三零 幺三五 二零六三 ****

      其他

      (86)(21)9899-80800-****

      八六 二幺 九八九九 八零八零零 ****

      支持“数字串+分隔符(左右括号、-)”方式。

    • 英文格式:

      格式

      示例

      英文输出

      说明

      数字串

      12034

      one two oh three four

      对数字串的长度没有特殊限制,建议不超过20位。当数字串以空格或连词符分组时,分组之间会插入逗号而产生适当停顿,支持最长5个分组。

      数字串+空格或连词符+数字串+空格或连词符+数字串

      1-23-456 7890

      one, two three, four five six, seven eight nine oh

      加号+数字串+空格或连词符+数字串

      +43-211-0567

      plus four three, two one one, oh five six seven

      左括号+数字串+右括号+空格+数字串+空格或连词符+数字串

      (21) 654-3210

      (two one) six five four, three two one oh

    字符(characters)

    • 中文格式:

      格式

      示例

      中文输出

      说明

      字符串

      ISBN 1-001-099098-1

      I S B N 一 杠 零 零 一 杠 零 九 九 零 九 八 杠 一

      支持中文汉字、大小写英文字符、阿拉伯数字0~9以及部分全角和半角字符。

      输出的空格表示每个字符之间插入停顿,即字符一个一个地读。标签内的文本如果包含XML的特殊字符,需要做字符转义。

      x10b2345_u

      x 一 零 b 二 三 四 五 下划线 u

      v1.0.1

      v 一 点 零 点 一

      版本号2.0

      版本号二 点 零

      M MA000

      M M A 零 零 零

      空中客车A330

      空中客车A 三 三 零

      型号s01 s02s03

      型号s 零 一 s 零二 和s 零 三

      空中客车A330

      空中客车A 三 三 零

      αβγ

      阿尔法 贝塔 伽玛

    • 英文格式:

      格式

      示例

      英文输出

      说明

      字符串

      *b+3$.c-0'=α

      asterisk B plus three dollar dot C dash zero apostrophe equals alpha

      支持中文汉字、大小写英文字符、阿拉伯数字0~9以及部分全角和半角字符。

      输出的空格表示每个字符之间插入停顿,即字符一个一个地读。

      标签内的文本如果包含XML的特殊字符,需要做字符转义。

    日期(date)

    • 中文格式:

      格式

      示例

      中文输出

      说明

      xx

      71

      七一年

      支持2位和4位年份。其中:

      • 2位年份支持60年~99年、00年~09年、10年~19年。

      • 4位年份支持1000年~1999年、2000年~2099年。

      04

      零四年

      19

      一九年

      1011

      一零一一年

      1998

      一九九八年

      2008

      二零零八年

      xxxx

      984

      九八年四月

      当月份为19月时,支持开头带“0”和不带“0”两种写法。例如:“19084月”和“190804月”。

      199804

      一九九八年四月

      088

      零八年八月

      20088

      二零零八年八月

      xxxxxxxxxxxx

      98423

      九八年四月二十三日

      当日期为19日时,支持开头带“0”和不带“0”两种写法。例如:“190848日”和“19080408日”。

      19980423

      一九九八年四月二十三日

      0888

      零八年八月八号

      20080808

      二零零八年八月八号

      xxxxxxxxxxxx

      98423

      九八年四月二十三日

      当日期为19日时,支持开头带“0”和不“0”两种写法。例如:“190848日”和“19080408日”。

      19980423

      一九九八年四月二十三日

      0888

      零八年八月八号

      20080808

      二零零八年八月八号

      xxxx

      320

      三月二十日

      -

      0807

      八月七号

      年月缩写

      2018/08

      二零一八年八月

      -

      2018-08

      二零一八年八月

      2018.08

      二零一八年八月

      年月日缩写

      2018/08/08

      二零一八年八月八日

      2018-8-8

      二零一八年八月八日

      2018.08.08

      二零一八年八月八日

      xxxxxx日~xxxxxxxxxxxx号~xxxxxx

      0491日~30

      零四年九月一日至三十日

      支持“~”、“-”作为“至”的缩写标志。

      20040901号-20080608

      二零零四年九月一号至二零零八年六月八号

      xxxxxx日~xxxxxxxx号~xx

      0491日~30

      零四年九月一日至三十日

      20040901号-20080608

      二零零四年九月一号至二零零八年六月八号

      xxxx月~xxxx

      0104月~1004

      零一年四月至一零年四月

      200104月~201004

      二零零一年四月至二零一零年四月

      xxxx日~xxxxxxxx号~xxxx

      101日~107

      十月一日至十月七日

      1001号~1007

      十月一号至十月七号

      xxxx日~xxxxxx号~xx

      101日~7

      十月一日至七日

      1001号~07

      十月一号至七号

      年月日缩写~年月日缩写

      2018/03/03~2019/01/01

      二零一八年三月三日至二零一九年一月一日

      支持“/”、“.”作为缩写的分隔符,支持“~”、“-”作为“至”的缩写标志。

      1997.9.9~1998.9.9

      一九九七年九月九日至一九九八年九月九日

      月日缩写~月日缩写

      10/20~10/31

      十月二十日至十月三十一日

      xx~xxxx月~xx

      1~10

      一至十月

      1月~10

      一月至十月

      月日年缩写

      10/20/2018

      二零一八年十月二十日

      仅支持4位的年份,仅支持“/”作为日期的分隔符,仅支持“月/日/年”的书写方式。

    • 英文格式:

      格式

      示例

      英文输出

      说明

      HH:MM AMPM

      09:00 AM

      nine A M

      HH表示一或两位数字小时,MM表示两位数字分钟,AM/PM表示上/下午。

      09:03 PM

      nine oh three P M

      09:13 p.m.

      nine thirteen p m

      HH:MM

      21:00

      twenty one hundred

      HHMM

      100

      one oclock

      时刻-时刻

      8:00 am - 05:30 pm

      eight a m to five p m

      支持常见时间格式和范围。

      7:05~10:15 AM

      seven oh five to ten fifteen A M

      09:00-13:00

      nine oclock to thirteen hundred

    时间(time)

    • 中文格式:

      格式

      示例

      中文输出

      说明

      时刻

      12:00

      十二点

      支持常用时间和时间范围格式。

      12:00:00

      十二点

      10:20

      十点二十分

      10:20:30

      十点二十分三十秒

      09:18:14

      九点十八分十四秒

      时刻~时刻

      11:00~12:00

      十一点到十二点

      09:00-14:00

      九点到十四点

      11:00~11:30

      十一点到十一点三十分

      11:00-12:18

      十一点到十二点十八分

      10:30~11:00

      十点三十分到十一点

      09:28-10:00

      九点二十八分到十点

      10:20~11:20

      十点二十分到十一点二十分

      06:00~08:00

      六点到八点

      上午10:20~下午13:30

      上午十点二十分到下午十三点三十分

      时间缩写

      5:00 am

      凌晨五点整

      5:30 am

      凌晨五点半

      5:20:12 am

      凌晨五点二十分十二秒

      7:00 am

      上午七点整

      7:30 AM

      上午七点半

      7:20:12 a.m.

      上午七点二十分十二秒

      07:08:12 A.M.

      上午七点零八分十二秒

      5:00 pm

      下午五点整

      5:30 PM

      下午五点半

      5:20:12 p.m.

      下午五点二十分十二秒

      05:09:12 P.M.

      下午五点零九分十二秒

      9:00 pm

      晚上九点整

      9:30 pm

      晚上九点半

      9:20:12 PM

      晚上九点二十分十二秒

      9:02:12 P.M.

      晚上九点零二分十二秒

      12:00 pm

      中午十二点整

      12:30 p.m.

      中午十二点半

      12:20:12 PM

      中午十二点二十分十二秒

    • 英文格式:

      格式

      示例

      英文输出

      说明

      HH:MM AMPM

      09:00 AM

      nine A M

      HH表示一或两位数字小时,MM表示两位数字分钟,AM/PM表示上/下午。

      09:03 PM

      nine oh three P M

      09:13 p.m.

      nine thirteen p m

      HH:MM

      21:00

      twenty one hundred

      HHMM

      100

      one oclock

      时刻-时刻

      8:00 am - 05:30 pm

      eight a m to five p m

      支持常见时间格式和范围。

      7:05~10:15 AM

      seven oh five to ten fifteen A M

      09:00-13:00

      nine oclock to thirteen hundred

  • <say-as>常见符号读法

    符号读法详情

    符号

    中文读法

    英文读法

    !

    感叹号

    exclamation mark

    双引号

    double quote

    #

    井号

    pound

    $

    dollar

    dollar

    %

    百分号

    percent

    &

    and

    and

    单引号

    left quote

    左括号

    left parenthesis

    右括号

    right parenthesis

    *

    asterisk

    +

    plus

    ,

    逗号

    comma

    -

    dash

    .

    dot

    /

    斜杠

    slash

    零冒号

    solon

    分号

    semicolon

    <

    小于

    less than

    =

    等号

    equals

    >

    大于

    greater than

    ?

    问号

    question mark

    @

    at

    at

    [

    左方括号

    left bracket

    \

    反斜线

    back slash

    ]

    右方括号

    right bracket

    ^

    脱字符

    caret

    _

    下划线

    underscore

    `

    反引号

    back quote

    {

    左花括号

    left brace

    |

    竖线

    vertical bar

    }

    右花括号

    right brace

    ~

    波浪线

    tilde

    叹号

    exclamation mark

    左双引号

    left double quote

    右双引号

    right double qute

    左单引号

    left quote

    右单引号

    right quote

    左括号

    left parenthesis

    右括号

    right parenthesis

    逗号

    comma

    句号

    full stop

    em dash

    冒号

    colon

    分号

    semicolon

    问号

    question mark

    顿号

    enumeration comma

    省略号

    ellipsis

    ……

    省略号

    ellipsis

    左书名号

    left guillemet

    右书名号

    right guillemet

    人民币符号

    yuan

    大于等于

    greater than or equal to

    小于等于

    less than or equal to

    不等于

    not equal

    约等于

    approximately equal

    ±

    加减

    plus or minus

    ×

    times

    π

    pi

    Α

    阿尔法

    alpha

    Β

    贝塔

    beta

    Γ

    伽玛

    gamma

    Δ

    德尔塔

    delta

    Ε

    艾普西龙

    epsilon

    Ζ

    捷塔

    zeta

    Θ

    西塔

    theta

    Ι

    艾欧塔

    iota

    Κ

    喀帕

    kappa

    拉姆达

    lambda

    Μ

    mu

    Ν

    nu

    Ξ

    克西

    ksi

    Ο

    欧麦克轮

    omicron

    pi

    Ρ

    rho

    西格玛

    sigma

    Τ

    tau

    Υ

    宇普西龙

    upsilon

    Φ

    fai

    phi

    Χ

    chi

    Ψ

    普赛

    psi

    Ω

    欧米伽

    omega

    α

    阿尔法

    alpha

    β

    贝塔

    beta

    γ

    伽玛

    gamma

    δ

    德尔塔

    delta

    ε

    艾普西龙

    epsilon

    ζ

    捷塔

    zeta

    η

    依塔

    eta

    θ

    西塔

    theta

    ι

    艾欧塔

    iota

    κ

    喀帕

    kappa

    λ

    拉姆达

    lambda

    μ

    mu

    ν

    nu

    ξ

    克西

    ksi

    ο

    欧麦克轮

    omicron

    π

    pi

    ρ

    rho

    σ

    西格玛

    sigma

    τ

    tau

    υ

    宇普西龙

    upsilon

    φ

    fai

    phi

    χ

    chi

    ψ

    普赛

    psi

    ω

    欧米伽

    omega

  • <say-as>常见计量单位

    计量单位详情

    格式

    类别

    中文示例

    英文示例

    缩写

    长度

    nm(纳米)、μm(微米)、 mm(毫米)、cm(厘米)、m(米)、km(千米)、ft(英尺)、in(英寸)

    nm (nanometre), μm (micrometre), mm (millimetre), cm (centimetre), m (metre), km (kilometre), ft (foot), in (inch)

    面积

    cm²(平方厘米)、㎡(平方米)、km²(平方千米)、SqFt(平方英尺)

    cm² (square centimetre), ㎡ (square metre), km2 (square kilometre), SqFt (square foot)

    体积

    cm³(立方厘米)、m³(立方米)、km³(立方千米)、mL(毫升)、L(升)、gallon(加仑)

    cm³ (cubic centimetre), m³ (cubic metre), km3 (cubic kilometre), mL (millilitre), L (millilitre), gal (gallon)

    重量

    μg(微克)、mg(毫克)、g(克)、kg(千克)

    μg (microgram), mg (microgram), g (gram), kg (kilogram)

    时间

    min(分)、sec(秒)、ms(毫秒)

    min (minute), sec (second), ms (millisecond)

    电磁

    μA(微安)、mA(毫安)、Ω(欧姆)、Hz(赫兹)、kHz(千赫兹)、MHz(兆赫兹)、GHz(吉赫兹)、V(伏)、kV(千伏)、kWh(千瓦时)

    μA (microamp), mA (milliamp), Hz (hertz), kHz (kilohertz), MHz (megahertz), GHz (gigahertz), V (volt), kV (kilovolt), kWh (kilowatt hour)

    声音

    dB(分贝)

    dB (decibel)

    气压

    Pa(帕)、kPa(千帕)、Mpa(兆帕)

    Pa (pascal), kPa (kilopascal), MPa (megapascal)

    其他常见单位

    支持不限于上述类别的中文单位,例如“米”、“秒”、“美元”、“毫升每瓶”等。以及中文量词,例如“架”、“场”、“头”、“部”、“盆”等。

    支持不限于上述类别的计量单位,例如 tsp (teaspoon), rpm (round per minute), KB (kilobyte), mmHg (milimetre of mercury) 等。

  • 示例及音频效果

    基数(cardinal)

    • 示例:

      <speak>
        <say-as interpret-as="cardinal">12345</say-as>
      </speak>

      中文音频效果:

    • 示例:

      <speak>
        <say-as interpret-as="cardinal">10234</say-as>
      </speak>

      英文音频效果:

    数字(digits)

    • 示例:

      <speak>
        <say-as interpret-as="digits">12345</say-as>
      </speak>

      中文音频效果:

    • 示例:

      <speak>
        <say-as interpret-as="digits">10234</say-as>
      </speak>

      英文音频效果:

    电话(telephone)

    • 示例:

      <speak>
        <say-as interpret-as="telephone">12345</say-as>
      </speak>

      中文音频效果:

    • 示例:

      <speak>
        <say-as interpret-as="telephone">10234</say-as>
      </speak>

      英文音频效果:

    字符(character)

    • 示例:

      <speak>
        <say-as interpret-as="characters">希腊字母αβ</say-as>
      </speak>

      中文音频效果:

    • 示例:

      <speak>
        <say-as interpret-as="characters">*b+3.c$=α</say-as>
      </speak>

      英文音频效果:

    日期(date)

    • 示例:

      <speak>
        <say-as interpret-as="date">1000-10-10</say-as>
      </speak>

      中文音频效果:

    • 示例:

      <speak>
        <say-as interpret-as="date">10-01-2020</say-as>
      </speak>

      英文音频效果:

    时间(time)

    • 示例:

      <speak>
        <say-as interpret-as="time">5:00am</say-as>
      </speak>

      中文音频效果:

    • 示例:

      <speak>
        <say-as interpret-as="time">0500</say-as>
      </speak>

      英文音频效果:

sub标签

  • 描述

    使用别名替换标签内文本。

  • 语法
    <sub alias="string"></sub>
  • 属性

    属性名称

    属性类型

    属性值

    是否必选

    描述

    alias

    String

    替换后的内容。

    用于替换标签内的文本。

  • 标签关系

    <sub>标签可以包括文本。

  • 示例
    <speak><sub alias="网络协议标准">W3C</sub></speak>
  • 音频效果

audio标签

  • 描述

    提示音标签,可以在MSML合成过程中,通过该标签在任意位置插入提示音。

  • 语法
    <audio src="URL"/>
  • 属性

    属性名称

    属性类型

    属性值

    是否必选

    描述

    src

    String

    URL提示音资源路径。

    您可以根据需求,使用自定义提示音。需要将提示音存放在阿里云OSS上,并且所在的存储空间至少为公共读权限,请参见创建存储空间,使用HTTP/HTTPS协议生成文件访问链接请参见控制台快速入门

    音频要求:

    • 采样率16 kHz、单声道WAV格式。

    • 不超过2 MB。

    • 位深度要求16位。

    重要

    您需要对上传的音频版权承担相应的法律责任。

  • 标签关系

    <audio>是空标签,不可以包含任何标签。

  • 示例
    <speak>
       一匹马受了惊吓<audio src="http://nls.alicdn.com/sound-event/horse-neigh.wav"/>人们四散躲避
     </speak>
  • 音频效果

phoneme标签

  • 描述

    用于控制标签内文本的读音,该标签是可选标签。英文文本不支持该标签。

  • 语法
    <phoneme alphabet="string" ph="string">文本</phoneme>
  • 属性

    属性名称

    属性类型

    属性值

    是否必选

    描述

    alphabet

    String

    • py:拼音。

    • cmu:英文音标发音。

    -

    ph

    String

    标签内文本对应的拼音串。

    拼音用法的赋值规范:

    • 字与字的拼音用空格分隔,拼音的数目必须与字数相等。

    • 每个拼音由发音和音调组成,音调为1~5的数字编号,其中”5”表示轻声。

  • 标签关系

    <phoneme>标签可以包括文本。

  • 示例
    <speak>
        去<phoneme alphabet="py" ph="dian3 dang4 hang2">典当行</phoneme>把这个玩意<phoneme alphabet="py" ph="dang4 diao4">当掉</phoneme>
     </speak>
  • 音频效果

通话控制标签(输出)

通话控制标签主要用于控制引擎进行通话操作,如控制挂断,转接等。

标签

用途描述

关键属性

示例代码

备注说明

<hangup>

用于播放完文本之后进行挂断处理。

<hangup/>

TTS输出标签的兼容标签。

通话行为标签(输入)

通话行为标签主要用于通信引擎识别通话过程中用户的行为,如通话冷场、打断机器人说话、声音情感等。

标签

用途描述

关键属性

示例代码

备注说明

<silence>

通话过程发生冷场行为。

time:时间。

<silence time="5s">

-

<user-interrupt>

发生了用户打断机器人说话行文。

无,标签包含的文本属于被打断前讲的最后一句。

<user-interrupt/>

-

<emotion>

声音情感。

  • category:情感分类。

  • intensity:置信度。

<emotion category="positive" intensity="0.2" >

  • category:当前句子的情感,取值:

    • positive:正面情感,如开心、满意。

    • negative:负面情感,如愤怒、沉闷、失望。

    • neutral:无明显情感。

  • intensity:当前句子识别情感的置信度,取值范围:[0.0,1.0]。值越大表示置信度越高。

示例

[
  {
    "role": "assistant",
    "content": "您好我是某快递客服,您有一个xxxx的包裹正在派送请注意查收。"
  },
  {
    "role": "user",
    "content": "<emotion category=\"neutral\" intensity=\"0.898\">我看到。</emotion>"
  },
  {
    "role": "assistant",
    "content": "好的,感谢您的理解。如果还有其他问题或需要进一步的帮助,请随时告诉我。祝您生活愉快!"
  },
  {
    "role": "user",
    "content": "<emotion category=\"neutral\" intensity=\"0.612\">我说什么时候派送啊?</emotion>"
  },
  {
    "role": "assistant",
    "content": "您好,根据您提供的信息,您的包裹正在派送中。具体的派送时间可能会因快递员路线安排、交通状况等因素的影响。如果您需要更准确的派送时间,建议您通过某APP的物流跟踪功能或直接联系快递员获取最新的派送时间。<user-interrupt/>"
  },
  {
    "role": "user",
    "content": "<emotion category=\"neutral\" intensity=\"0.976\">行,先这样吧。</emotion>"
  }
]