ListExperiments - 获取实验列表

获取实验列表。

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

授权信息

下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:

  • 操作:是指具体的权限点。
  • 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
  • 资源类型:是指操作中支持授权的资源类型。具体说明如下:
    • 对于必选的资源类型,用前面加 * 表示。
    • 对于不支持资源级授权的操作,用全部资源表示。
  • 条件关键字:是指云产品自身定义的条件关键字。
  • 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
操作访问级别资源类型条件关键字关联操作
eflo:ListExperimentslist
*Experiment
acs:eflo:{#regionId}:{#accountId}:experiment/*

请求参数

名称类型必填描述示例值
PlanIdlong

计划 ID

189
Orderinteger

次序

1
ResourceGroupIdstring

资源组 id

rg-uo8f26cpmo

返回参数

名称类型描述示例值
object

实验对象列表

Dataarray<object>

数据

Dataobject
ExperimentIdlong

实验 id

1684537476910997506
CreateTimelong

创建时间

2024-10-22 10:18:10
UpdateTimelong

更新时间

2024-10-22 10:18:10
ExperimentNamestring

实验名称

test
ExperimentTypestring

实验类型

AI
ResourceNamestring

资源名称

ecs.r8y.4xlarge
WorkloadNamestring

负载名称

test
StartTimestring

任务开始时间

2024-10-22 10:18:10
EndTimestring

任务结束时间

2024-10-22 10:28:10
Statusstring

状态

RUNNING
Resultsobject

任务结果

ExperimentIdlong

参数名称

440
Durationdouble

时间

20
SecondsPerIterationdouble

每次迭代的秒数

89
SamplesPerSeconddouble

每秒采样数

10
Mfudouble

MFU

34
WarningWorkerarray<object>

警告 worker

WarningWorkerobject
ExperimentIdlong

实验 id

113
Hostnamestring

主机 ip

101.66.165.102
PodNamestring

Pod 名称

hzs-forge-sdxl-online-7ff4d86444-pc95h
GpuNuminteger

GPU 数量

90
GpuNamestring

GPU 名称

8x OAM 810 GPU
WarningFlagboolean

是否有报警

false
WarningMsgstring

报警信息

ErrorFlagboolean

是否有错误

false
ErrorMsgstring

错误信息

Tflopsdouble

TFLOPS 值

43
SamplesPerSeconddouble

吞吐量

53
ErrorWorkerarray<object>

错误节点

ErrorWorkerobject

错误节点

ExperimentIdlong

实验 id

176
Hostnamestring

主机 ip

etcd_cluster_c0n2
PodNamestring

Pod 名称

fluxserv-6fc89b45cf-w8wq6
GpuNuminteger

GPU 数量

8
GpuNamestring

GPU 名称

8x OAM 810 GPU
WarningFlagboolean

是否有报警

false
WarningMsgstring

报警信息

ErrorFlagboolean

是否有错误

false
ErrorMsgstring

错误信息

Tflopsdouble

TFLOPS 值

42
SamplesPerSeconddouble

吞吐量

65
SetParamsobject

运行的负载参数

string

参数

{}
GetParamsobject

解析的负载参数

string

参数

{}
EnvParamsobject

运行的环境参数

CpuPerWorkerinteger

cpu 分配数

90
GpuPerWorkerinteger

gpu 分配数

8
MemoryPerWorkerinteger

内存 GB 分配数

500
ShareMemoryinteger

共享内存 GB 分配数

500
WorkerNuminteger

节点数

1
CudaVersionstring

cudaVersion

1.0.0
NCCLVersionstring

NCCLVersion

1.0.0
GpuDriverVersionstring

GpuDriverVersion

1.0.0
PyTorchVersionstring

PyTorchVersion

1.0.0
ResourceNodesarray<object>

指定的节点

ResourceNodeobject
NodeNamestring

节点名称

lingj1xxnjt1k4nv-mg18v52pydyuumae-0
TotalCPUinteger

总的 cpu

90
TotalGPUinteger

总的 gpu

8
TotalMemorylong

总的 memory

500
RequestCPUinteger

当前请求的 cpu

90
RequestGPUinteger

当前请求的 gpu

8
RequestMemoryinteger

当前请求的 memory

500
ExtendParamobject

额外的参数

string

参数

{}
RequestIdstring

请求 id

5514CB39-B7C0-5B89-8534-2DE1E0F2B7AB
AccessDeniedDetailstring

无权限信息

{}
TotalCountlong

查询总数

0

示例

正常返回示例

JSON格式

{
  "Data": [
    {
      "ExperimentId": 1684537476910997500,
      "CreateTime": 0,
      "UpdateTime": 0,
      "ExperimentName": "test",
      "ExperimentType": "AI",
      "ResourceName": "ecs.r8y.4xlarge",
      "WorkloadName": "test",
      "StartTime": "2024-10-22 10:18:10",
      "EndTime": "2024-10-22 10:28:10",
      "Status": "RUNNING",
      "Results": {
        "ExperimentId": 440,
        "Duration": 20,
        "SecondsPerIteration": 89,
        "SamplesPerSecond": 10,
        "Mfu": 34,
        "WarningWorker": [
          {
            "ExperimentId": 113,
            "Hostname": "101.66.165.102",
            "PodName": "hzs-forge-sdxl-online-7ff4d86444-pc95h",
            "GpuNum": 90,
            "GpuName": "8x OAM 810 GPU",
            "WarningFlag": false,
            "WarningMsg": "无",
            "ErrorFlag": false,
            "ErrorMsg": "无",
            "Tflops": 43,
            "SamplesPerSecond": 53
          }
        ],
        "ErrorWorker": [
          {
            "ExperimentId": 176,
            "Hostname": "etcd_cluster_c0n2",
            "PodName": "fluxserv-6fc89b45cf-w8wq6",
            "GpuNum": 8,
            "GpuName": "8x OAM 810 GPU",
            "WarningFlag": false,
            "WarningMsg": "无",
            "ErrorFlag": false,
            "ErrorMsg": "无",
            "Tflops": 42,
            "SamplesPerSecond": 65
          }
        ]
      },
      "SetParams": {
        "key": {}
      },
      "GetParams": {
        "key": {}
      },
      "EnvParams": {
        "CpuPerWorker": 90,
        "GpuPerWorker": 8,
        "MemoryPerWorker": 500,
        "ShareMemory": 500,
        "WorkerNum": 1,
        "CudaVersion": "1.0.0",
        "NCCLVersion": "1.0.0",
        "GpuDriverVersion": "1.0.0",
        "PyTorchVersion": "1.0.0",
        "ResourceNodes": [
          {
            "NodeName": "lingj1xxnjt1k4nv-mg18v52pydyuumae-0",
            "TotalCPU": 90,
            "TotalGPU": 8,
            "TotalMemory": 500,
            "RequestCPU": 90,
            "RequestGPU": 8,
            "RequestMemory": 500
          }
        ],
        "ExtendParam": {
          "key": {}
        }
      }
    }
  ],
  "RequestId": "5514CB39-B7C0-5B89-8534-2DE1E0F2B7AB",
  "AccessDeniedDetail": {},
  "TotalCount": 0
}

错误码

访问错误中心查看更多错误码。