通过配置事件通知,可以追踪和监控DLC任务或工作流任务的状态,或当模型版本状态变更时自动触发下游操作。
一、开通事件总线并授权(首次配置)
首次创建通知规则前,需完成事件总线(EventBridge)的开通与权限配置。
请按以下路径进入配置页面:前往工作空间详情,进入指定工作空间后,单击右上角 。
1.1 开通事件总线EventBridge
在事件通知配置页签,单击免费开通,可跳转至事件总线(EventBridge)的开通页面。详情请参见开通事件总线EventBridge。
开通后,PAI会为每个工作空间自动创建一个名为pai-system-${工作空间名称}
的自定义事件总线。可以前往EventBridge控制台,切换到目标地域,查看自定义总线列表并进行管理。
1.2 授权PAI访问云资源
如图单击去授权,系统会自动创建服务关联角色AliyunServiceRoleForPAIWorkspace,用于授权PAI访问您的云资源。关于该角色的更多内容,请参见附录:PAI工作空间服务关联角色。
1.3 (可选)为RAM用户授予事件通知配置权限
如果使用RAM用户(子账号)进行配置,需要为其授予操作事件总线的权限。
{
"Statement": [{
"Effect": "Allow",
"Action": [
"eventbridge:CreateEventBus",
"eventbridge:GetEventBus",
"eventbridge:DeleteEventBus",
"eventbridge:ListEventBuses",
"eventbridge:CreateRule",
"eventbridge:GetRule",
"eventbridge:UpdateRule",
"eventbridge:EnableRule",
"eventbridge:DisableRule",
"eventbridge:DeleteRule",
"eventbridge:ListRules",
"eventbridge:PutEvents",
"eventbridge:UpdateTargets",
"eventbridge:DeleteTargets",
"eventbridge:ListTargets"
],
"Resource": "acs:eventbridge:*:*:eventbus/*"
}],
"Version": "1"
}
二、创建事件规则
完成首次配置后,请前往工作空间详情,进入指定工作空间后,在 页面,单击新建事件规则进行配置。
2.1 配置事件类型
选择希望监控的事件源及其具体的事件类型。
工作流任务:监控Designer工作流任务的状态。事件类型包含任务失败和任务结束(包含成功和失败)。
DLC任务:监控DLC任务的生命周期事件。事件类型包含任务进程(进入排队、开始竞价、开始运行、任务失败等)、任务自动容错、任务超时(需要在调度配置中配置超时规则)、其他事件(任务被抢占、任务被手动停止等)。
模型:监控AI资产管理中模型版本的状态变更。事件类型包含模型版本允许上线(状态由Pending变为Approved)和模型版本状态改变(包含允许上线和不允许上线)。
2.2 配置事件目标
配置事件发生时,通知的发送方式和接收方。
钉钉通知:需要配置Webhook和加签参数(详情请参见附录:获取Webhook和密钥)。配置完成后,可单击测试连通性进行验证。
HTTP/HTTPS:当模型版本状态发生变化时,自动调用指定的URL。此方式仅适用于模型事件类型,且接口需按照规范模板进行解析。
语音电话:向指定联系人拨打电话进行通知。此方式仅适用于工作流任务或DLC任务。如无可选联系人,请先完成消息接收设置。
短信:配置方法与语音电话相同。
邮件:配置方法与语音电话相同。
单条规则下事件目标数量默认为5,若不能满足要求,可申请配额,建议配额申请量不超过100。注意:在配置语音电话、短信、邮件时,每添加一个联系人会占用一个配额(联系人不去重累加)。例如,在短信中添加联系人Alice、Tony,在邮件中添加了Alice、Alan,则短信和邮件共占配额为4。
常见问题
问:进入事件通知配置页面出现报错:
ServiceNotEnable
答:此报错说明尚未开通事件总线EventBridge服务,请先开通事件总线EventBridge。