ListOnlineEvalTaskResults - 获取一个链路评估任务的结果列表

获取链路评估任务的结果列表。

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

授权信息

下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:

  • 操作:是指具体的权限点。
  • 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
  • 资源类型:是指操作中支持授权的资源类型。具体说明如下:
    • 对于必选的资源类型,用前面加 * 表示。
    • 对于不支持资源级授权的操作,用全部资源表示。
  • 条件关键字:是指云产品自身定义的条件关键字。
  • 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
操作访问级别资源类型条件关键字关联操作
paillmtrace:ListOnlineEvalTaskResultsget
*OnlineEvaluation
acs:paillmtrace:{#regionId}:{#accountId}:onlineevaluation/{#OnlineEvaluationId}

请求语法

GET /api/v1/PAILLMTrace/onlineevaltaskresults HTTP/1.1

请求参数

名称类型必填描述示例值
TraceIdsarray

指定一组链路 id,只返回这些链路的评估结果。链路 id 和任务 Id 至少要设置其中一个。

string

链路 id

3fbb8d864ac0004b7e41b6f4512c80ae
PageNumberinteger

当前页数。取值范围:大于 0 的整数。默认值:1。

2
PageSizeinteger

分页大小,默认为 10,最大为 50。

50
EvaluationIdstring

评估任务的 id。链路 id 和任务 Id 至少要设置其中一个。

0bb05ae8888c11ef9757faaa2a1ec0c6
MostRecentResultsOnlyboolean

同一条链路数据可能会被不同的任务都评估过。如果不指定任务 id,且同一个链路 id 有多条评估结果,那么这个参数指定是否只返回最新的一条评估结果。默认为 True,只返回最新的一条结果。

True

返回参数

名称类型描述示例值
object

Schema of Response

RequestIdstring

Id of the request

22BA9A5A-E3D8-5B4C-90FC-F33F6E5853F8
Codestring

内部错误码。只在响应出错时被设置。

InvalidInputParams
Messagestring

响应错误信息。只在响应出错时被设置。

must provide trace_id(s) or eval_id
EvaluationResultsarray

评估结果列表。

EvaluationResultsstring

一条链路记录的评估结果。

{ "result": { "correctness": { "label": "正确", "score": 1, "reason": " \n - 回顾问题:询问了26岁理工宅男的礼物建议。\n - 回顾答案:提供了多种礼物建议,包括智能穿戴设备、最新款电子产品、编程相关书籍、DIY组装套件、桌游或拼图、科幻小说/漫画集、个性化定制礼品、体验式礼物。\n - 回答内容详细且具体,提供了多种选择。\n - 回答内容与问题相关,提供了多种礼物建议。\n</think>\n<answer>{\"label\":\"正确\", \"reason\":\"提供了多种礼物建议,与问题相关,内容详细且具体。\"}</answer></answer>", "name": "正确性" }, "faithfulness": { "label": "事实", "score": 1, "reason": " \n - 回顾查询内容,用户询问了适合26岁理工宅男的礼物建议。\n - 回答内容提供了多个具体的礼物建议,包括智能穿戴设备、最新款电子产品、编程相关书籍、DIY组装套件、桌游或拼图、科幻小说/漫画集、个性化定制礼品、体验式礼物。\n - 回答内容提供了多种可能的礼物选项,这些选项在逻辑上是合理的,且与用户的需求相关。\n - 回答内容没有提供虚构的信息,因此可以认为是基于事实的。\n</think>\n<answer>{\"label\":\"事实\", \"reason\":\"回答内容提供了多种可能的礼物选项,这些选项在逻辑上是合理的,且与用户的需求相关。\"}</answer></answer>", "name": "真实性" } }, "eval_app_type": "qa" }
TotalCountinteger

符合条件的评估结果的总数。

123

示例

正常返回示例

JSON格式

{
  "RequestId": "22BA9A5A-E3D8-5B4C-90FC-F33F6E5853F8",
  "Code": "InvalidInputParams",
  "Message": "must provide trace_id(s) or eval_id",
  "EvaluationResults": [
    {
      "result": {
        "correctness": {
          "label": "正确",
          "score": 1,
          "reason": " \n    - 回顾问题:询问了26岁理工宅男的礼物建议。\n    - 回顾答案:提供了多种礼物建议,包括智能穿戴设备、最新款电子产品、编程相关书籍、DIY组装套件、桌游或拼图、科幻小说/漫画集、个性化定制礼品、体验式礼物。\n    - 回答内容详细且具体,提供了多种选择。\n    - 回答内容与问题相关,提供了多种礼物建议。\n</think>\n<answer>{\"label\":\"正确\", \"reason\":\"提供了多种礼物建议,与问题相关,内容详细且具体。\"}</answer></answer>",
          "name": "正确性"
        },
        "faithfulness": {
          "label": "事实",
          "score": 1,
          "reason": " \n    - 回顾查询内容,用户询问了适合26岁理工宅男的礼物建议。\n    - 回答内容提供了多个具体的礼物建议,包括智能穿戴设备、最新款电子产品、编程相关书籍、DIY组装套件、桌游或拼图、科幻小说/漫画集、个性化定制礼品、体验式礼物。\n    - 回答内容提供了多种可能的礼物选项,这些选项在逻辑上是合理的,且与用户的需求相关。\n    - 回答内容没有提供虚构的信息,因此可以认为是基于事实的。\n</think>\n<answer>{\"label\":\"事实\", \"reason\":\"回答内容提供了多种可能的礼物选项,这些选项在逻辑上是合理的,且与用户的需求相关。\"}</answer></answer>",
          "name": "真实性"
        }
      },
      "eval_app_type": "qa"
    }
  ],
  "TotalCount": 123
}

错误码

访问错误中心查看更多错误码。