文本符号说明
支持单词内部符号
符号 | 例子 | 说明 |
[a-z][A-Z] | good | 支持26个字母(大小写均支持)组成的常用英文单词 |
- | four-legged | 单词内连字符 |
' | don't | 单词内连字符 |
. | John.Smith | 单词内连字符 |
: | 18:16 | |
@ | -- | 用于邮箱 |
_ | -- | 单词内连字符 |
支持的单词边界分隔符号
符号 | 例子 | 说明 |
, | No, thank you. | 句内分隔符 |
. | Good morning. Nice to see you. | 句子分隔符 |
; | I not only like bread; but also like rice. | 句内分隔符 |
? | How old are you? | 句子分隔符 |
! | Have a nice day! | 句子分隔符 |
" | "May I speak to Tom", I said. | 引用符号 |
@ | My email is mi**@***.***. | 邮箱地址分隔符,读作“at”,@后面按字母发音来读 |
. | My email is mi**@***.***. | 邮箱地址分隔符,读作“dot” |
注:对于词尾的“.”,先根据缩写词列表判断是否是缩写词,不是缩写词,当作分句句号。
支持的数字发音
例子 | 对应读法 | 备注 |
2 | two / february | |
56 | fifty six | |
456 | four hundred fifty six/four five six | |
1990 | nineteen ninety/one thousand nine hundred ninety/one nine nine o | |
87th | eighty seven th | |
19:40 | nineteen fourty/twenty to twenty | |
19.21 | nineteen twenty one | 对带"."的文本,会分成两个数值,如果想将. 发音成point,建议手工修改文本,将"."换成point |
1,000 | one o o o/one zero zero zero | 数字中包含","时,会被分成两个单词,如果想作为一个单词,需要显式的将","移除 |
注:数字一般不收录在内部字典中,上面是评分引擎预测发音的规则,建议客户最好将数字转成对应的英文单词。
其他常见符号处理
符号 | 说明 | 例子 |
非UTF-8编码 | 转换成UTF-8编码 | 常见主要是ASCII编码中前128个字符 |
其他与发音、停顿或者语速相关的符号 | 替换成上述支持单词边界分割字符,;?!" | |
其他与发音、停顿或者语速非相关的符号 | 除全角字母、数字、标点会转化为对应的半角格式,其它的则直接去除,因为不影响口语评分 |