通过配置事件通知,可以追踪和监控DLC任务、工作流任务和DSW实例的状态,或当模型版本状态变更时自动触发下游操作。
一、开通事件总线并授权(首次配置)
首次创建通知规则前,需完成事件总线EventBridge的开通与权限配置。
请按以下路径进入配置页面:前往工作空间详情,进入指定工作空间后,单击右上角。
1.1 开通事件总线EventBridge
在事件通知配置页签,单击免费开通,可跳转至事件总线EventBridge的开通页面。详情请参见开通事件总线EventBridge。

开通后,PAI会为每个工作空间自动创建一个名为pai-system-${工作空间名称}的自定义事件总线。可以前往EventBridge控制台,切换到目标地域,查看自定义总线列表并进行管理。
1.2 授权PAI访问云资源
如图单击去授权,系统会自动创建服务关联角色AliyunServiceRoleForPAIWorkspace,用于授权PAI访问您的云资源。关于该角色的更多内容,请参见附录:PAI工作空间服务关联角色。

1.3 (可选)为RAM用户授予事件通知配置权限
如果使用RAM用户(子账号)进行配置,需要为其授予操作事件总线的权限。
{
"Statement": [{
"Effect": "Allow",
"Action": [
"eventbridge:CreateEventBus",
"eventbridge:GetEventBus",
"eventbridge:DeleteEventBus",
"eventbridge:ListEventBuses",
"eventbridge:CreateRule",
"eventbridge:GetRule",
"eventbridge:UpdateRule",
"eventbridge:EnableRule",
"eventbridge:DisableRule",
"eventbridge:DeleteRule",
"eventbridge:ListRules",
"eventbridge:PutEvents",
"eventbridge:UpdateTargets",
"eventbridge:DeleteTargets",
"eventbridge:ListTargets"
],
"Resource": "acs:eventbridge:*:*:eventbus/*"
}],
"Version": "1"
}二、创建事件规则
完成首次配置后,请前往工作空间详情,进入指定工作空间后,在页面,单击新建事件规则进行配置。

2.1 配置事件类型
选择希望监控的事件源及其具体的事件类型。
工作流任务:监控Designer工作流任务的状态。事件类型包含任务失败和任务结束(包含成功和失败)。
DLC任务:监控DLC任务的生命周期事件。事件类型包含任务进程(进入排队、开始竞价、开始运行、任务失败等)、任务自动容错、任务超时(需要在调度配置中配置超时规则)、其他事件(任务被抢占、任务被手动停止等)。
模型:监控AI资产管理中模型版本的状态变更。事件类型包含模型版本允许上线(状态由Pending变为Approved)和模型版本状态改变(包含允许上线和不允许上线)。
DSW实例:监控DSW实例及镜像保存的状态变更。事件类型包括实例常规状态变化(创建中、实例失败等)、镜像保存(镜像保存中、镜像保存成功、镜像保存失败等)、实例关机(实例停止、停止中)。
2.2 配置事件目标
配置事件发生时,通知的发送方式和接收方。
钉钉通知:需要配置Webhook和加签参数(详情请参见附录:获取Webhook和密钥)。配置完成后,可单击测试连通性进行验证。
企业微信通知:需配置企业微信消息推送的Webhook地址。
飞书通知:需配置飞书自定义机器人的Webhook地址。
HTTP/HTTPS:当模型版本状态发生变化时,自动调用指定的URL。此方式仅适用于模型事件类型,且接口需按照规范模板进行解析。
语音电话、短信、邮件:向指定联系人拨打电话、发送短信或邮件进行通知。此方式不适用于模型类型事件。如无可选联系人,请先完成消息接收设置。
单条规则下事件目标数量默认为5,若不能满足要求,可申请配额,建议配额申请量不超过100。注意:在配置语音电话、短信、邮件时,每添加一个联系人会占用一个配额(联系人不去重累加)。例如,在短信中添加联系人Alice、Tony,在邮件中添加了Alice、Alan,则短信和邮件共占配额为4。
常见问题
Q:进入事件通知配置页面出现报错:ServiceNotEnable

此报错说明尚未开通事件总线EventBridge服务,请先开通事件总线EventBridge。
附录:获取Webhook和密钥
在需要接收通知的钉钉群中,按照下图操作指引,进入群机器人对话框。

按照下图操作指引,进入添加机器人对话框。

在添加机器人对话框中,配置以下参数,复制密钥,然后单击完成。
重要您需要将复制的密钥保存到本地,方便后续使用。

在添加机器人对话框中,单击复制和完成。
重要您需要将webhook内容保存到本地,方便后续使用。

步骤3和步骤4中获取的密钥和Webhook,即为事件通知配置中创建事件规则需要配置的加签和Webhook内容。