将多个测评任务添加到列表中,按照检索相关性、综合得分、检索准确率、无幻觉率等维度展示各评测任务结果。
操作步骤
选择目标地域,切换到OpenSearch-LLM智能问答版。
在实例列表单击目标实例右侧的管理,在左侧导航栏选择效果对比。
在评测任务页签下,单击效果对比,选择评测任务,单击开始对比,查看各任务评测结果。
单击测试报告查看每条问答的评测结果,如评测结果不准确,单击人工评估,对结果进行人工订正。
文档内容是否对您有帮助?
将多个测评任务添加到列表中,按照检索相关性、综合得分、检索准确率、无幻觉率等维度展示各评测任务结果。
选择目标地域,切换到OpenSearch-LLM智能问答版。
在实例列表单击目标实例右侧的管理,在左侧导航栏选择效果对比。
在评测任务页签下,单击效果对比,选择评测任务,单击开始对比,查看各任务评测结果。
单击测试报告查看每条问答的评测结果,如评测结果不准确,单击人工评估,对结果进行人工订正。