设置钉钉机器人报警后,您可以通过指定钉钉群接收报警通知。本文为您介绍如何配置钉钉机器人接收Kubeflow报警。

前提条件

  • 已创建DataScience集群,且选择了Kubeflow服务,详情请参见创建集群
  • 下载dsdemo代码:请已创建DataScience集群的用户,使用钉钉搜索钉钉群号32497587加入钉钉群以获取dsdemo代码。

操作步骤

  1. 配置钉钉机器人并获取Webhook地址。
    在您想要添加报警机器人的钉钉群的右上角找到群机器人,然后添加一个自定义通过Webhook接入的机器人并进行安全设置,同时获取Webhook地址。

    具体操作请参见安全设置获取自定义机器人Webhook

    图 1. 安全设置
    安全设置
    注意 安全设置勾选自定义关键词,使用alert作为关键词。
    图 2. 获取Webhook地址
    获取Webhook地址
    注意 请保管好此Webhook地址,以备后用。Webhook地址格式为https://oapi.dingtalk.com/robot/send?access_token=*****
  2. 配置Kubeflow报警。
    1. 上传获取到的dsdemo*.zip至DataScience集群的header节点。
    2. 通过SSH方式连接DataScience集群,详情请参见登录集群
    3. 解压dsdemo*.zip
    4. 修改ml_on_ds目录下的config文件。
      config文件中新增ACCESS_TOKEN参数,参数值为上步骤中获取到的Webhook地址中的access_tokenAccess_token