调用ListOnlineEvalTaskResults获取链路评估任务的结果列表-人工智能平台 PAI-阿里云

获取链路评估任务的结果列表。

调试

您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。

授权信息

下表是API对应的授权信息，可以在RAM权限策略语句的Action元素中使用，用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下：

操作：是指具体的权限点。
访问级别：是指每个操作的访问级别，取值为写入（Write）、读取（Read）或列出（List）。
资源类型：是指操作中支持授权的资源类型。具体说明如下：
- 对于必选的资源类型，用前面加 * 表示。
- 对于不支持资源级授权的操作，用全部资源表示。
条件关键字：是指云产品自身定义的条件关键字。
关联操作：是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限，操作才能成功。

操作	访问级别	资源类型	条件关键字	关联操作
paillmtrace:ListOnlineEvalTaskResults	get	*OnlineEvaluation `acs:paillmtrace:{#regionId}:{#accountId}:onlineevaluation/{#OnlineEvaluationId}`	无	无

请求语法

GET /api/v1/PAILLMTrace/onlineevaltaskresults HTTP/1.1

请求参数

名称	类型	必填	描述	示例值
TraceIds	array	否	指定一组链路 id，只返回这些链路的评估结果。链路 id 和任务 Id 至少要设置其中一个。
	string	否	链路 id	3fbb8d864ac0004b7e41b6f4512c80ae
PageNumber	integer	否	当前页数。取值范围：大于 0 的整数。默认值：1。	2
PageSize	integer	否	分页大小，默认为 10，最大为 50。	50
EvaluationId	string	否	评估任务的 id。链路 id 和任务 Id 至少要设置其中一个。	0bb05ae8888c11ef9757faaa2a1ec0c6
MostRecentResultsOnly	boolean	否	同一条链路数据可能会被不同的任务都评估过。如果不指定任务 id，且同一个链路 id 有多条评估结果，那么这个参数指定是否只返回最新的一条评估结果。默认为 True，只返回最新的一条结果。	True

返回参数

名称	类型	描述	示例值
	object	Schema of Response
RequestId	string	Id of the request	22BA9A5A-E3D8-5B4C-90FC-F33F6E5853F8
Code	string	内部错误码。只在响应出错时被设置。	InvalidInputParams
Message	string	响应错误信息。只在响应出错时被设置。	must provide trace_id(s) or eval_id
EvaluationResults	array	评估结果列表。
EvaluationResults	string	一条链路记录的评估结果。	{ "result": { "correctness": { "label": "正确", "score": 1, "reason": " \n - 回顾问题：询问了26岁理工宅男的礼物建议。\n - 回顾答案：提供了多种礼物建议，包括智能穿戴设备、最新款电子产品、编程相关书籍、DIY组装套件、桌游或拼图、科幻小说/漫画集、个性化定制礼品、体验式礼物。\n - 回答内容详细且具体，提供了多种选择。\n - 回答内容与问题相关，提供了多种礼物建议。\n</think>\n<answer>{\"label\":\"正确\", \"reason\":\"提供了多种礼物建议，与问题相关，内容详细且具体。\"}</answer></answer>", "name": "正确性" }, "faithfulness": { "label": "事实", "score": 1, "reason": " \n - 回顾查询内容，用户询问了适合26岁理工宅男的礼物建议。\n - 回答内容提供了多个具体的礼物建议，包括智能穿戴设备、最新款电子产品、编程相关书籍、DIY组装套件、桌游或拼图、科幻小说/漫画集、个性化定制礼品、体验式礼物。\n - 回答内容提供了多种可能的礼物选项，这些选项在逻辑上是合理的，且与用户的需求相关。\n - 回答内容没有提供虚构的信息，因此可以认为是基于事实的。\n</think>\n<answer>{\"label\":\"事实\", \"reason\":\"回答内容提供了多种可能的礼物选项，这些选项在逻辑上是合理的，且与用户的需求相关。\"}</answer></answer>", "name": "真实性" } }, "eval_app_type": "qa" }
TotalCount	integer	符合条件的评估结果的总数。	123

示例

正常返回示例

JSON格式

{
  "RequestId": "22BA9A5A-E3D8-5B4C-90FC-F33F6E5853F8",
  "Code": "InvalidInputParams",
  "Message": "must provide trace_id(s) or eval_id",
  "EvaluationResults": [
    {
      "result": {
        "correctness": {
          "label": "正确",
          "score": 1,
          "reason": " \n    - 回顾问题：询问了26岁理工宅男的礼物建议。\n    - 回顾答案：提供了多种礼物建议，包括智能穿戴设备、最新款电子产品、编程相关书籍、DIY组装套件、桌游或拼图、科幻小说/漫画集、个性化定制礼品、体验式礼物。\n    - 回答内容详细且具体，提供了多种选择。\n    - 回答内容与问题相关，提供了多种礼物建议。\n</think>\n<answer>{\"label\":\"正确\", \"reason\":\"提供了多种礼物建议，与问题相关，内容详细且具体。\"}</answer></answer>",
          "name": "正确性"
        },
        "faithfulness": {
          "label": "事实",
          "score": 1,
          "reason": " \n    - 回顾查询内容，用户询问了适合26岁理工宅男的礼物建议。\n    - 回答内容提供了多个具体的礼物建议，包括智能穿戴设备、最新款电子产品、编程相关书籍、DIY组装套件、桌游或拼图、科幻小说/漫画集、个性化定制礼品、体验式礼物。\n    - 回答内容提供了多种可能的礼物选项，这些选项在逻辑上是合理的，且与用户的需求相关。\n    - 回答内容没有提供虚构的信息，因此可以认为是基于事实的。\n</think>\n<answer>{\"label\":\"事实\", \"reason\":\"回答内容提供了多种可能的礼物选项，这些选项在逻辑上是合理的，且与用户的需求相关。\"}</answer></answer>",
          "name": "真实性"
        }
      },
      "eval_app_type": "qa"
    }
  ],
  "TotalCount": 123
}

错误码

访问错误中心查看更多错误码。