事件通知配置

通过配置事件通知,可以追踪和监控DLC任务或工作流任务的状态,或当模型版本状态变更时自动触发下游操作。

一、开通事件总线并授权(首次配置)

首次创建通知规则前,需完成事件总线(EventBridge)的开通与权限配置。

请按以下路径进入配置页面:前往工作空间详情,进入指定工作空间后,单击右上角工作空间配置 > 事件通知配置

1.1 开通事件总线EventBridge

在事件通知配置页签,单击免费开通,可跳转至事件总线(EventBridge)的开通页面。详情请参见开通事件总线EventBridge

image

开通后,PAI会为每个工作空间自动创建一个名为pai-system-${工作空间名称}的自定义事件总线。可以前往EventBridge控制台,切换到目标地域,查看自定义总线列表并进行管理。

1.2 授权PAI访问云资源

如图单击去授权,系统会自动创建服务关联角色AliyunServiceRoleForPAIWorkspace,用于授权PAI访问您的云资源。关于该角色的更多内容,请参见附录:PAI工作空间服务关联角色

image

1.3 (可选)为RAM用户授予事件通知配置权限

如果使用RAM用户(子账号)进行配置,需要为其授予操作事件总线的权限。

创建自定义权限策略,并RAM用户授权。策略内容如下:

{
  "Statement": [{
    "Effect": "Allow",
    "Action": [
      "eventbridge:CreateEventBus",
      "eventbridge:GetEventBus",
      "eventbridge:DeleteEventBus",
      "eventbridge:ListEventBuses",
      "eventbridge:CreateRule",
      "eventbridge:GetRule",
      "eventbridge:UpdateRule",
      "eventbridge:EnableRule",
      "eventbridge:DisableRule",
      "eventbridge:DeleteRule",
      "eventbridge:ListRules",
      "eventbridge:PutEvents",
      "eventbridge:UpdateTargets",
      "eventbridge:DeleteTargets",
      "eventbridge:ListTargets"
    ],
    "Resource": "acs:eventbridge:*:*:eventbus/*"
  }],
  "Version": "1"
}

二、创建事件规则

完成首次配置后,请前往工作空间详情,进入指定工作空间后,在工作空间配置 > 事件通知配置页面,单击新建事件规则进行配置。

image

2.1 配置事件类型

选择希望监控的事件源及其具体的事件类型。

  • 工作流任务:监控Designer工作流任务的状态。事件类型包含任务失败和任务结束(包含成功和失败)。

  • DLC任务:监控DLC任务的生命周期事件。事件类型包含任务进程(进入排队、开始竞价、开始运行、任务失败等)、任务自动容错、任务超时(需要在调度配置中配置超时规则)、其他事件(任务被抢占、任务被手动停止等)。

  • 模型:监控AI资产管理中模型版本的状态变更。事件类型包含模型版本允许上线(状态由Pending变为Approved)和模型版本状态改变(包含允许上线和不允许上线)。

2.2 配置事件目标

配置事件发生时,通知的发送方式和接收方。

  • 钉钉通知:需要配置Webhook和加签参数(详情请参见附录:获取Webhook和密钥)。配置完成后,可单击测试连通性进行验证。

  • HTTP/HTTPS:当模型版本状态发生变化时,自动调用指定的URL。此方式仅适用于模型事件类型,且接口需按照规范模板进行解析。

  • 语音电话:向指定联系人拨打电话进行通知。此方式仅适用于工作流任务DLC任务。如无可选联系人,请先完成消息接收设置

  • 短信:配置方法与语音电话相同。

  • 邮件:配置方法与语音电话相同。

重要

单条规则下事件目标数量默认为5,若不能满足要求,可申请配额,建议配额申请量不超过100。注意:在配置语音电话、短信、邮件时,每添加一个联系人会占用一个配额(联系人不去重累加)。例如,在短信中添加联系人Alice、Tony,在邮件中添加了Alice、Alan,则短信和邮件共占配额为4。

常见问题

  1. 问:进入事件通知配置页面出现报错:ServiceNotEnable

    image

    答:此报错说明尚未开通事件总线EventBridge服务,请先开通事件总线EventBridge