获取链路评估任务的结果列表。
调试
您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。
授权信息
下表是API对应的授权信息,可以在RAM权限策略语句的Action
元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:
- 操作:是指具体的权限点。
- 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
- 资源类型:是指操作中支持授权的资源类型。具体说明如下:
- 对于必选的资源类型,用前面加 * 表示。
- 对于不支持资源级授权的操作,用
全部资源
表示。
- 条件关键字:是指云产品自身定义的条件关键字。
- 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
操作 | 访问级别 | 资源类型 | 条件关键字 | 关联操作 |
---|---|---|---|---|
paillmtrace:ListOnlineEvalTaskResults | get | *OnlineEvaluation acs:paillmtrace:{#regionId}:{#accountId}:onlineevaluation/{#OnlineEvaluationId} |
| 无 |
请求语法
GET /api/v1/PAILLMTrace/onlineevaltaskresults HTTP/1.1
请求参数
名称 | 类型 | 必填 | 描述 | 示例值 |
---|---|---|---|---|
TraceIds | array | 否 | 指定一组链路 id,只返回这些链路的评估结果。链路 id 和任务 Id 至少要设置其中一个。 | |
string | 否 | 链路 id | 3fbb8d864ac0004b7e41b6f4512c80ae | |
PageNumber | integer | 否 | 当前页数。取值范围:大于 0 的整数。默认值:1。 | 2 |
PageSize | integer | 否 | 分页大小,默认为 10,最大为 50。 | 50 |
EvaluationId | string | 否 | 评估任务的 id。链路 id 和任务 Id 至少要设置其中一个。 | 0bb05ae8888c11ef9757faaa2a1ec0c6 |
MostRecentResultsOnly | boolean | 否 | 同一条链路数据可能会被不同的任务都评估过。如果不指定任务 id,且同一个链路 id 有多条评估结果,那么这个参数指定是否只返回最新的一条评估结果。默认为 True,只返回最新的一条结果。 | True |
返回参数
示例
正常返回示例
JSON
格式
{
"RequestId": "22BA9A5A-E3D8-5B4C-90FC-F33F6E5853F8",
"Code": "InvalidInputParams",
"Message": "must provide trace_id(s) or eval_id",
"EvaluationResults": [
{
"result": {
"correctness": {
"label": "正确",
"score": 1,
"reason": " \n - 回顾问题:询问了26岁理工宅男的礼物建议。\n - 回顾答案:提供了多种礼物建议,包括智能穿戴设备、最新款电子产品、编程相关书籍、DIY组装套件、桌游或拼图、科幻小说/漫画集、个性化定制礼品、体验式礼物。\n - 回答内容详细且具体,提供了多种选择。\n - 回答内容与问题相关,提供了多种礼物建议。\n</think>\n<answer>{\"label\":\"正确\", \"reason\":\"提供了多种礼物建议,与问题相关,内容详细且具体。\"}</answer></answer>",
"name": "正确性"
},
"faithfulness": {
"label": "事实",
"score": 1,
"reason": " \n - 回顾查询内容,用户询问了适合26岁理工宅男的礼物建议。\n - 回答内容提供了多个具体的礼物建议,包括智能穿戴设备、最新款电子产品、编程相关书籍、DIY组装套件、桌游或拼图、科幻小说/漫画集、个性化定制礼品、体验式礼物。\n - 回答内容提供了多种可能的礼物选项,这些选项在逻辑上是合理的,且与用户的需求相关。\n - 回答内容没有提供虚构的信息,因此可以认为是基于事实的。\n</think>\n<answer>{\"label\":\"事实\", \"reason\":\"回答内容提供了多种可能的礼物选项,这些选项在逻辑上是合理的,且与用户的需求相关。\"}</answer></answer>",
"name": "真实性"
}
},
"eval_app_type": "qa"
}
],
"TotalCount": 123
}
错误码
访问错误中心查看更多错误码。