本文将为您介绍如何载入DataWorks中处理好的数据到人工智能平台PAI中,构建窃漏电用户的识别模型。
前提条件
开始本文的操作前,请首先完成加工数据中的操作。
新建实验
新建空白工作流并进入工作流,具体操作,请参见新建自定义工作流。
载入数据集
在左侧组件列表,将源/目标下的读数据表组件拖入画布中,并重命名为data4ml。
在画布中选中data4ml节点,在右侧节点配置页面中的表名中输入
data4ml
,读取表数据。右键单击画布中的data4ml节点,在快捷菜单,单击执行该节点。
节点运行成功后,右键单击data4ml,选择 ,即可查看载入的结果数据。数据包括电量趋势下降指标、线损指标和告警类指标数量等窃电漏电指标,以及用户是否真实窃电漏电的数据。
进行数据探索
相关性分析
在左侧组件列表,将统计分析下的相关系数矩阵组件拖入画布中。
通过连线,将相关系数矩阵-1节点作为data4ml节点的下游节点。
右键单击相关系数矩阵-1,在快捷菜单,单击执行该节点。
待运行完成后,右键单击相关系数矩阵-1,在快捷菜单,单击可视化分析,来查看分析报告。
特征分析
在左侧组件列表,将统计分析下的数据视图组件拖入画布中。
通过连线,将数据视图-1节点作为data4ml节点的下游节点。
单击画布中的数据视图-1节点,在右侧字段设置页签,将特征列设置为trend、xiansun和warnindicator3个字段,将目标列设置为flag。
右键单击数据视图-1,在快捷菜单,单击执行该节点。
待运行完成后,右键单击数据视图-1,在快捷菜单,单击可视化分析。即可查看各个特征和标签列在数据分布上的关系。
进行数据建模
完成简单的探索性分析之后,即可开始选择合适的算法模型进行数据建模。
通过拆分组件,将数据分为训练集和测试集。
在左侧组件列表,将数据预处理下的拆分组件拖入画布中。
通过连线,将拆分-1节点作为data4ml节点的下游节点。
右键单击拆分-1,在快捷菜单,单击执行该节点。
待运行完成后,右键单击拆分-1,选择 ,查看拆分后的表数据。
通过逻辑回归二分类组件,对数据进行回归建模。
在左侧组件列表,将 下的逻辑回归二分类组件拖入画布中。
通过连线,将逻辑回归二分类-1节点作为拆分-1节点输出表1端口的下游节点。
单击画布中的逻辑回归二分类-1节点,在右侧字段设置页签,将特征列设置为trend、xiansun和warnindicator3个字段,将目标列设置为flag。
右键单击逻辑回归二分类-1,在快捷菜单,单击执行该节点。
执行完成后,右键单击逻辑回归二分类-1,选择 ,即可查看数据模型。
预测和评估回归模型
通过预测组件,预测该模型在测试数据集上的效果。
在左侧组件列表,将机器学习下的预测组件拖入画布中。
通过连线,将预测-1节点的模型结果输入端口和预测数据输入端口分别作为逻辑回归二分类-1节点的逻辑回归模型端口和拆分-1节点的输出表2端口的下游节点。
单击画布中的预测-1节点,在右侧字段设置页签,特征列默认全选,将原样输出列设置为uid、trend、xiansun、warnindicator、flag5个字段。
右键单击预测-1,在快捷菜单,单击执行该节点。
执行完成后,右键单击预测-1,在快捷菜单,选择 ,查看预测结果。
通过二分类评估组件,获取模型效果。
在左侧组件列表,将 下的二分类评估组件拖入画布中。
通过连线,将二分类评估-1节点作为预测-1节点下游节点。
单击画布中的二分类评估-1节点,在右侧字段设置页签,将原始标签列列名设置为flag。
右键单击二分类评估-1,在快捷菜单,单击执行该节点。
执行完成后,右键单击二分类评估-1,在快捷菜单,单击可视化分析,即可查看模型效果。
后续步骤
至此,您已通过人工智能平台PAI完成了用户窃电行为的识别。您还可以通过EAS在线部署,将该服务部署为可在线调用的服务,提供用户窃电行为的在线识别服务。