干预词典的词条详情。
示例
{
"cmd": "add",
"word": "过儿",
"created": 1536661485,
"updated": 1537320187,
"status": "ACTIVE",
"relevance": {
"100": "0",
"200": "2"
}
}
结构
各干预词典的词条结构各有不同,区分为共有字段 + 特有字段,详情如下 :
共有字段
字段 | 类型 | 描述 |
cmd | String | 操作命令
|
word | String | 词条 |
status | String | 状态
|
created | Integer | 创建时间戳 |
updated | Integer | 更新时间戳 |
特有字段
stopword 停用词
字段 | 类型 | 描述 |
stopword | Boolean | 干预类型
|
synonym 同义词
字段 | 类型 | 描述 |
alias | Array | 添加的同义词 |
antiAlias | Array | 屏蔽的同义词 |
correction 拼写纠错
字段 | 类型 | 描述 |
correction | String | 纠正词 |
enabled | Boolean | 干预类型
|
category_prediction 类目预测
字段 | 类型 | 描述 |
relevance | Object | 干预内容键为类目预测ID,值为相关度(0:不相关;1:略相关;2:相关)例:{“2”:1,”100”:0} |
term_weighting 词权重
字段 | 类型 | 描述 |
tokens[] | Object | 词权重内容 |
tokens[].token | String | term |
tokens[].weight | int | term权重,有7(权重高)、4(权重中)、1(权重低) |
示例
{
"word": "谭浩强c语言程序设计",
"tokens": [
{
"token": "谭浩强",
"weight": 7
},
{
"token": "c语言",
"weight": 7
},
{
"token": "程序",
"weight": 1
},
{
"token": "设计",
"weight": 1
}
]
}
ner 实体识别
字段 | 类型 | 描述 |
tokens[] | Object | 干预内容 |
tokens[].tag | String |
|
tokens[].tagLabel | String | 识别结果的中文名,同上,注意:传参时不需要此字段 |
tokens[].token | String | 实体词 |
tokens[].order | Integer | 序号 |
matchType | Integer | 匹配类型,0 表示全query匹配时干预生效,1 表示query中有部分匹配干预也生效默认:0 |
示例
{
"cmd": "add",
"word": "豆本豆豆奶",
"created": 1593429234,
"updated": 1593429242,
"status": "ACTIVE",
"tokens": [{
"tag": "category",
"tagLabel": "品类",
"token": "豆",
"order": 1
},
{
"tag": "category",
"tagLabel": "品类",
"token": "本",
"order": 2
},
{
"tag": "common",
"tagLabel": "普通词",
"token": "豆豆",
"order": 3
},
{
"tag": "category",
"tagLabel": "品类",
"token": "奶",
"order": 4
}
]
}
、
suggest_allowlist 下拉提示白名单
无
suggest_denylist下拉提示黑名单
无
hot_allowlist 热搜白名单
字段 | 类型 | 描述 |
rank | Integer | 位置,取值范围:[1-10] |
expirationTime | Integer | 过期时间戳(秒) |
hot_denylist 热搜黑名单
无
hint_allowlist 底纹白名单
字段 | 类型 | 描述 |
expirationTime | Integer | 过期时间戳(秒) |
hint_denylist 底纹黑名单
无