实体是同类型单词的合集,如:城市、日期、颜色等。语义通过实体进行理解,然后抽取并输出机器可以理解的格式。例如用户说「我喜欢绿色」,虽然都知道绿色是一种颜色,但如果不预先告诉机器,机器是不会知道的。为了让机器能够理解绿色,可以创建一个词库,把常见的颜色列举,这样机器再遇到这些词,就能知道是一种颜色。
新建标准实体
在生活和业务当中,有很多不同的词语代表着同一种意思,例如:北京、帝都、中国首都。这几个词语都是指同一个城市,那么就可以通过配置的方式将这些词语指定到一个固定的实体下面。
创建一个火车座次的实体,在这个实体下面定义了两种不同等级的座位。这个实体就可以直接在意图里面进行使用了。
正则实体
正则表达式是一种可以用于模式匹配和替换的规范,一个正则表达式就是由普通的字符(例如字符a到z)以及特殊字符(元字符)组成的文字模式,它用以描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。
系统实体
为了让用户快速使用对话流的配置,系统预置了很多实体供用户直接使用。
界面名称 |
中文意思 |
实体解释 |
例子 |
标准值(识别到的格式) |
@sys.number |
系统.数字 |
解析句子中的所有数字,包括中文数字和阿拉伯数字 |
一百二十五、100、零点三 |
123 |
@sys.phone-number |
系统.手机号码 |
解析手机号码 |
1*78***** |
1*78***** |
@sys.date |
系统.日期 |
解析所有的日期表达方式 |
明天、下周一、三月二十号、明年六月份、国庆节、2017-10-5 |
2017-11-11 |
@sys.time |
系统.时间 |
解析一天内的时间 |
上午九点、中午12点半、傍晚八点一刻 |
12:10:15 |
@sys.date-time |
系统.日期时间 |
解析日期加时间 |
明天中午十二点半、下周三早上八点一刻 |
2017-11-11 10:00:00 |
@sys.geo-city |
系统.城市 |
解析中国的所有城市 |
北京、杭州、上海 |
北京市 |
@sys.geo-province |
系统.省份 |
解析中国的所有省份 |
浙江、河北 |
浙江省 |
@sys.geo-country |
系统.国家 |
解析世界上的所有国家 |
中国、新加坡、毛里求斯 |
中国 |
@sys.age |
系统.年龄 |
解析年龄数字 |
15岁、30了、五十岁 |
30 |
@sys.address |
系统. 地址 |
解析多层级复杂地址 |
中国上海市静安区巨鹿路882号 |
中国上海市静安区巨鹿路882号 |
@sys.geo-district |
系统-区县 |
解析标准的区县 |
朝阳区 |
朝阳区 |
@sys.name |
系统-⼈名 |
鲁迅 |
鲁迅 |
|
@sys.duration |
系统.时间段 |
解析一个时间段、持续时间 |
一小时、15分钟、一小时零五分等 |
|
@sys.timeset |
系统.重复时间 |
解析一个重复时间点的实体 |
每周一、每个工作日等 |
|
@sys.money |
系统-⾦额 |
解析金额 |
200元 |
|
@sys.temperature |
系统-温度 |
解析温度 |
20度、90摄⽒度、20.5华⽒度 |
|
@sys.numberrange |
系统-数字范围 |
解析数字范围 |
⼀到五,⼤于10 |
|
@sys.plate-number |
系统-⻋牌号 |
解析车牌号 |
浙A12345 |
浙A12345 |
@sys.surname |
系统-百家姓 |
解析姓氏 |
张 |
张 |
@sys.numberfraction |
系统-分数 |
解析分数 |
三分之⼀,1/3 |
1/3 |
@sys.percentage |
系统-百分数 |
解析百分数 |
百分之20,20% |
20% |
实体管理
重命名:重命名实体名称(注意:实体名称是定义实体的唯⼀信息,实体使⽤后不建议修改实体名称) 实体配置:配置实体的具体信息,标准实体配置实体成员及对应的同义词,正则实体配置正则表达式。 发布:将实体的配置发布到线上环境(发布对话机器⼈的时候,会同步发布实体;只有单独修改实体配置的时候可使⽤此发布功能) 导出:⽀持单个实体导出,批量导出和全量导出。导⼊实体基本信息(实体名和类型),实体配置。基本信息不推荐在导出⽂件中编辑修改,实体配置可以在导⼊⽂件中增加,导⼊后实体配置会⾃动进⾏合并。 导⼊:⽀持导⼊实体。导⼊意图可以新增实体成员、新增同义词、正则表达式。 搜索:可以使⽤实体名称检索机器⼈内的实体