控制台中内置了问答测试页面方便用户进行问答测试,输入问题模型就会匹配到对应的结果进行回答。完成实例配置后,您可针对不同场景和不同期望效果设置相应参数,通过体验问答效果,来选择最优参数。本文以控制台操作为例介绍如何进行问答测试并对可自定义的参数进行说明。
前提条件
操作步骤
登录OpenSearch控制台选择LLM智能问答版,选择左侧导航栏实例管理,单击对应的实例操作栏下的管理按钮,进入实例详情页面,选择问答测试,可以向模型进行提问。
可根据搜索需求填写对应的问答参数、Prompt参数、文档召回参数、参考图片参数、Query理解参数、人工干预参数及其它参数,然后在对话框输入需要询问的内容,单击发送按钮。
查看问答测试效果。
参数说明
问答参数说明 | |||||
参数 | 类型 | 必需 | 取值范围 | 默认值 | 描述 |
模型选择 | String | 是 | - | opensearch-qwen | 表示该次搜索使用的LLM大模型。可选择的模型请参考:LLM管理。 |
Prompt | String | 否 | - | 系统默认模板 | 表示该次搜索使用的Prompt。可选择的Prompt请参考:Prompt管理 |
多轮对话 | Boolean | 否 | - | true |
|
流式输出 | Boolean | 否 | - | true |
|
Prompt参数说明 | |||||
参数 | 类型 | 必需 | 取值范围 | 默认值 | 描述 |
attitude | String | 否 | - | normal |
|
rule | String | 否 | - | simple | 对话内容的详细程度,默认为detailed
|
noanswer | String | 否 | - | sorry | 无法回答问题时的回复,默认为sorry
|
language | String | 否 | - | Chinese | 回答问题使用的语言,默认为Chinese
|
role | Boolean | 否 | - | true | 开启后,将定制回答的角色。 |
role_name | String | 否 | - | AI小助手 | 定制回答的角色,例如:AI小助手 |
out_format | String | 否 | - | text | 输出内容的形式,默认为text
|
文档召回参数说明 | |||||
参数 | 类型 | 必需 | 取值范围 | 默认值 | 描述 |
filter | String | 否 | - | - | 召回文档时根据目标字段进行过滤。例:filter = field = value |
top_n | INT | 否 | (0, 50] | 5 | 召回的文档数。 |
sf | Float | 否 | [0,+∞) | 1.3 | 文档召回的阈值,sf越大则召回文档的向量相似度越小。 |
dense_weight | Float | (0,1) | 0.7 | 选择稀疏向量模型时可选,表示稠密向量的权重,稀疏向量的权重则为:1-dense_weight。 | |
formula | String | 否 | - | 向量相似度 | 文档召回的排序公式。 |
operator | String | 否 | - | AND | 文本召回时,文本token之间的关系。 |
参考图片参数说明 | |||||
参数 | 类型 | 必需 | 取值范围 | 默认值 | 描述 |
sf | Float | 否 | [0,+∞) | 1 | 参考图片的阈值,对于稀疏向量模型sf越大则参考图片与内容的向量相似度越大,对于稠密向量模型sf越大则参考图片与内容的向量相似度越小。 |
dense_weight | Float | 否 | (0,1) | 0.7 | 选择稀疏向量模型时可选,表示稠密向量的权重,稀疏向量的权重则为:1-dense_weight。 |
Query理解参数说明 | |||||
参数 | 类型 | 必需 | 取值范围 | 默认值 | 描述 |
query_extend | Boolean | 否 | - | false | 开启后会扩展Query,提升召回质量 |
query_exten_num | INT | 否 | (0,+∞) | 5 | 扩展Query的数量 |
人工干预参数说明 | |||||
参数 | 类型 | 必需 | 取值范围 | 默认值 | 描述 |
sf | Float | 否 | [0,2] | 0.3 | 人工干预问题的阈值,默认为0.3,sf越大则越容易匹配到人工干预词条 |
其它参数说明 | |||||
参数 | 类型 | 必需 | 取值范围 | 默认值 | 描述 |
return_hits | Boolean | 否 | - | false | 是否在结果中返回文档召回的结果 |
csi_level | String | 否 | - | strict | 绿网配置
|
history_max | INT | 否 | (0,20] | 20 | 多轮对话历史最大轮数,最大20轮 |
link | Boolean | 否 | - | false | 是否在结果中返回文档召回的具体来源 |