文本符号说明

更新时间:

支持单词内部符号

符号

例子

说明

[a-z][A-Z]

good

支持26个字母(大小写均支持)组成的常用英文单词

-

four-legged

单词内连字符

'

don't

单词内连字符

.

John.Smith

单词内连字符

:

18:16

@

--

用于邮箱

_

--

单词内连字符

支持的单词边界分隔符号

符号

例子

说明

,

No, thank you.

句内分隔符

.

Good morning. Nice to see you.

句子分隔符

;

I not only like bread; but also like rice.

句内分隔符

?

How old are you?

句子分隔符

!

Have a nice day!

句子分隔符

"

"May I speak to Tom", I said.

引用符号

@

My email is mi**@***.***.

邮箱地址分隔符,读作“at”,@后面按字母发音来读

.

My email is mi**@***.***.

邮箱地址分隔符,读作“dot”

注:对于词尾的“.”,先根据缩写词列表判断是否是缩写词,不是缩写词,当作分句句号。

支持的数字发音

例子

对应读法

备注

2

two / february

56

fifty six

456

four hundred fifty six/four five six

1990

nineteen ninety/one thousand nine hundred ninety/one nine nine o

87th

eighty seven th

19:40

nineteen fourty/twenty to twenty

19.21

nineteen twenty one

对带"."的文本,会分成两个数值,如果想将. 发音成point,建议手工修改文本,将"."换成point

1,000

one o o o/one zero zero zero

数字中包含","时,会被分成两个单词,如果想作为一个单词,需要显式的将","移除

注:数字一般不收录在内部字典中,上面是评分引擎预测发音的规则,建议客户最好将数字转成对应的英文单词。

其他常见符号处理

符号

说明

例子

UTF-8编码

转换成UTF-8编码

常见主要是ASCII编码中前128个字符

其他与发音、停顿或者语速相关的符号

替换成上述支持单词边界分割字符,;?!"

其他与发音、停顿或者语速非相关的符号

除全角字母、数字、标点会转化为对应的半角格式,其它的则直接去除,因为不影响口语评分