效果对比

将多个测评任务添加到列表中,按照检索相关性、综合得分、检索准确率、无幻觉率等维度展示各评测任务结果。

操作步骤

  1. 登录OpenSearch控制台

  2. 选择目标地域,切换到OpenSearch-LLM智能问答版

  3. 在实例列表单击目标实例右侧的管理,在左侧导航栏选择效果对比

  4. 评测任务页签下,单击效果对比,选择评测任务,单击开始对比,查看各任务评测结果。

    image

    单击测试报告查看每条问答的评测结果,如评测结果不准确,单击人工评估,对结果进行人工订正。