实体是同类型单词的合集,如:城市、日期、颜色等。语义通过实体进行理解,然后抽取并输出机器可以理解的格式。例如用户说「我喜欢绿色」,虽然都知道绿色是一种颜色,但如果不预先告诉机器,机器是不会知道的。为了让机器能够理解绿色,可以创建一个词库,把常见的颜色列举,这样机器再遇到这些词,就能知道是一种颜色。
新建标准实体
在生活和业务当中,有很多不同的词语代表着同一种意思,例如:北京、帝都、中国首都。这几个词语都是指同一个城市,那么就可以通过配置的方式将这些词语指定到一个固定的实体下面。
创建一个火车座次的实体,在这个实体下面定义了两种不同等级的座位。这个实体就可以直接在意图里面进行使用了。
正则实体
正则表达式是一种可以用于模式匹配和替换的规范,一个正则表达式就是由普通的字符(例如字符a到z)以及特殊字符(元字符)组成的文字模式,它用以描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。
系统实体
为了让用户快速使用对话工厂,系统预置了很多实体供用户直接使用。
界面名称 | 中文意思 | 实体解释 | 例子 | 标准值(识别到的格式) |
@sys.number | 系统.数字 | 解析句子中的所有数字,包括中文数字和阿拉伯数字 | 一百二十五、100、零点三 | 123 |
@sys.phone-number | 系统.手机号码 | 解析手机号码 | 1*78***** | 1*78***** |
@sys.date | 系统.日期 | 解析所有的日期表达方式 | 明天、下周一、三月二十号、明年六月份、国庆节、2017-10-5 | 2017-11-11 |
@sys.time | 系统.时间 | 解析一天内的时间 | 上午九点、中午12点半、傍晚八点一刻 | 12:10:15 |
@sys.date-time | 系统.日期时间 | 解析日期加时间 | 明天中午十二点半、下周三早上八点一刻 | 2017-11-11 10:00:00 |
@sys.geo-city | 系统.城市 | 解析中国的所有城市 | 北京、杭州、上海 | 北京市 |
@sys.geo-province | 系统.省份 | 解析中国的所有省份 | 浙江、河北 | 浙江省 |
@sys.geo-country | 系统.国家 | 解析世界上的所有国家 | 中国、新加坡、毛里求斯 | 中国 |
@sys.age | 系统.年龄 | 解析年龄数字 | 15岁、30了、五十岁 | 30 |
@sys.address | 系统. 地址 | 解析多层级复杂地址 | 中国上海市静安区巨鹿路882号 | 中国上海市静安区巨鹿路882号 |
@sys.geo-district | 系统-区县 | 解析标准的区县 | 朝阳区 | 朝阳区 |
@sys.name | 系统-⼈名 | 解析人名 | 鲁迅 | 鲁迅 |
@sys.duration | 系统.时间段 | 解析一个时间段、持续时间 | 一小时、15分钟、一小时零五分等 | |
@sys.timeset | 系统.重复时间 | 解析一个重复时间点的实体 | 每周一、每个工作日等 | |
@sys.money | 系统-⾦额 | 解析金额 | 200元 | |
@sys.temperature | 系统-温度 | 解析温度 | 20度、90摄⽒度、20.5华⽒度 | |
@sys.numberrange | 系统-数字范围 | 解析数字范围 | ⼀到五,⼤于10 | |
@sys.plate-number | 系统-⻋牌号 | 解析车牌号码 | 浙A12345 | |
@sys.surname | 系统-百家姓 | 解析姓氏 | 张 | |
@sys.numberfraction | 系统-分数 | 解析分数 | 三分之⼀,1/3 | |
@sys.percentage | 系统-百分数 | 解析百分数 | 百分之20,20% |
实体管理
重命名:重命名实体名称(注意:实体名称是定义实体的唯⼀信息,实体使⽤后不建议修改实体名称) 实体配置:配置实体的具体信息,标准实体配置实体成员及对应的同义词,正则实体配置正则表达式。 发布:将实体的配置发布到线上环境(发布对话机器⼈的时候,会同步发布实体;只有单独修改实体配置的时候可使⽤此发布功能) 导出:⽀持单个实体导出,批量导出和全量导出。导⼊实体基本信息(实体名和类型),实体配置。基本信息不推荐在导出⽂件中编辑修改,实体配置可以在导⼊⽂件中增加,导⼊后实体配置会⾃动进⾏合并。 导⼊:⽀持导⼊实体。导⼊意图可以新增实体成员、新增同义词、正则表达式。 搜索:可以使⽤实体名称检索机器⼈内的实体