实体是同类型单词的合集,如:城市、日期、颜色等。语义通过实体进行理解,然后抽取并输出机器可以理解的格式。例如用户说「我喜欢绿色」,虽然都知道绿色是一种颜色,但如果不预先告诉机器,机器是不会知道的。为了让机器能够理解绿色,可以创建一个词库,把常见的颜色列举,这样机器再遇到这些词,就能知道是一种颜色。

新建标准实体

在生活和业务当中,有很多不同的词语代表着同一种意思,例如:北京、帝都、中国首都。这几个词语都是指同一个城市,那么就可以通过配置的方式将这些词语指定到一个固定的实体下面。

图-1

创建一个火车座次的实体,在这个实体下面定义了两种不同等级的座位。这个实体就可以直接在意图里面进行使用了。

正则实体

正则表达式是一种可以用于模式匹配和替换的规范,一个正则表达式就是由普通的字符(例如字符a到z)以及特殊字符(元字符)组成的文字模式,它用以描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。图-2

系统实体

为了让用户快速使用对话工厂,系统预置了很多实体供用户直接使用。

界面名称

中文意思

实体解释

例子

标准值(识别到的格式)

@sys.number

系统.数字

解析句子中的所有数字,包括中文数字和阿拉伯数字

一百二十五、100、零点三

123

@sys.phone-number

系统.手机号码

解析手机号码

1*78*****

1*78*****

@sys.date

系统.日期

解析所有的日期表达方式

明天、下周一、三月二十号、明年六月份、国庆节、2017-10-5

2017-11-11

@sys.time

系统.时间

解析一天内的时间

上午九点、中午12点半、傍晚八点一刻

12:10:15

@sys.date-time

系统.日期时间

解析日期加时间

明天中午十二点半、下周三早上八点一刻

2017-11-11 10:00:00

@sys.geo-city

系统.城市

解析中国的所有城市

北京、杭州、上海

北京市

@sys.geo-province

系统.省份

解析中国的所有省份

浙江、河北

浙江省

@sys.geo-country

系统.国家

解析世界上的所有国家

中国、新加坡、毛里求斯

中国

@sys.age

系统.年龄

解析年龄数字

15岁、30了、五十岁

30

@sys.address

系统. 地址

解析多层级复杂地址

中国上海市静安区巨鹿路882号

中国上海市静安区巨鹿路882号

@sys.geo-district

系统-区县

解析标准的区县

朝阳区

朝阳区 ​

@sys.name

系统-⼈名

解析人名

鲁迅

鲁迅

@sys.duration

系统.时间段

解析一个时间段、持续时间

一小时、15分钟、一小时零五分等

@sys.timeset

系统.重复时间

解析一个重复时间点的实体

每周一、每个工作日等

@sys.money

系统-⾦额

解析金额

200元

@sys.temperature

系统-温度

解析温度

20度、90摄⽒度、20.5华⽒度

@sys.numberrange

系统-数字范围

解析数字范围

⼀到五,⼤于10

@sys.plate-number

系统-⻋牌号

解析车牌号码

浙A12345

@sys.surname

系统-百家姓

解析姓氏

@sys.numberfraction

系统-分数

解析分数

三分之⼀,1/3

@sys.percentage

系统-百分数

解析百分数

百分之20,20%

实体管理

图-3重命名:重命名实体名称(注意:实体名称是定义实体的唯⼀信息,实体使⽤后不建议修改实体名称) 实体配置:配置实体的具体信息,标准实体配置实体成员及对应的同义词,正则实体配置正则表达式。 发布:将实体的配置发布到线上环境(发布对话机器⼈的时候,会同步发布实体;只有单独修改实体配置的时候可使⽤此发布功能) 导出:⽀持单个实体导出,批量导出和全量导出。导⼊实体基本信息(实体名和类型),实体配置。基本信息不推荐在导出⽂件中编辑修改,实体配置可以在导⼊⽂件中增加,导⼊后实体配置会⾃动进⾏合并。 导⼊:⽀持导⼊实体。导⼊意图可以新增实体成员、新增同义词、正则表达式。 搜索:可以使⽤实体名称检索机器⼈内的实体