PAI提供了特征编码、模型训练及模型评估全套功能,您只需要抽取异常行为特征,并对其进行标记,即可快速构建异常指标监控模型。
背景信息
用户系统中的异常数据(例如运维系统的CPU消耗突然增高或某平台突然产生大量不良信息)属于平台异常指标。如果能实时高效地监控平台指标,并对各种异常指标进行预防和实时预警,将大幅度提升平台的智能化安全防卫能力。
解决方案
PAI提供了一套基于指标监控的分类算法,将异常指标监控抽象为二分类场景,并将监控模型部署至在线系统,从而实现近线风控。该方案的要求如下:
- 人力要求:需要熟悉机器学习经典算法,尤其是特征工程及二分类算法。
- 开发周期:1~2天。
- 数据要求:上千条的标签数据,该数据标记了异常数据和正常数据。
数据集
本工作流使用的数据为系统级别监控日志数据,共22544条数据,其中异常数据为9711条。工作流的示例数据如下。

参数名称 | 参数描述 |
---|---|
protocol_type | 网络连接协议,包括tcp、icmp及udp等。 |
service | 服务协议,包括HTTP、finger、pop、private及smtp等。 |
flage | 取值包括SF、RSTO及REJ。 |
a2~a38 | 不同的系统指标。 |
class | 标签字段。其中normal表示正常样本,anomaly表示异常样本。 |
异常指标监控
- 进入PAI-Designer页面。
- 登录PAI控制台。
- 在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称,进入对应工作空间内。
- 在工作空间页面的左侧导航栏选择 ,进入Designer页面。
- 构建工作流。
- 运行工作流并查看模型效果。