阿里云首页 工业大脑开放平台

工艺模式建模

本文为您介绍算法组件中的工艺模式建模组件。

功能说明

工艺模式建模将根据描述变量对案例进行分类,识别不同的状态。然后针对每个状态,找到最可靠的推荐变量,保证评价变量符合预期。

计算逻辑原理

工艺模式建模是基于庞大的历史优质案例,每个案例具有描述变量,评价变量和推荐变量。

  • 描述变量:描述生产工况的参数,比如原料质检结果,环境温度等。

  • 评价变量:描述生产的结果,比如产品质量、生产能耗等。

  • 推荐变量:执行的生产参数,比如设备的温度,压力等。

算法首先会使用历史数据构造案例库。存在描述变量时,有两种案例库建模方法。第一种是‘案例指标优先’,第二种为‘案例特征优先’。

案例指标优先:

    • 适用场景:历史案例包含多类别且优劣案例分布无显著差异,或所有案例属于同类。

    • 优点:计算量小,运行速度快。

    • 缺点:存在多类案例且每类案例评价变量的分布存在显著差异时,无法保障每类的案例被均匀选入。因该建模方法优先筛选出满足条件的案例的这一步骤,会造成评价指标更优的一类案例被大量选入案例库。

案例特征优先:

    • 适用场景:历史案例包含多类别且不通类别中优劣案例的分布相差很大。

    • 优点:每类案例被均匀选入。

    • 缺点:适用的场景较为局限。

不存在描述变量时,案例库的建模方式即基于全部的历史案例筛选出满足条件的案例构成优质案例库。

参数说明

IN端口

参数名

参数描述

是否必填

输入数据类型

数据源类型

评价变量

根据评价变量来筛选优质案例。目前算法仅支持有且仅有一个评价变量的情况。

整数或浮点数

说明

若存在非数值数据,则会抛出异常

  • csv组件

  • igateoffline组件

  • 平台上其他数据处理组件

  • 按照平台组件开发的自定义组件

推荐变量

希望通过优质案例重用得到推荐变量对应的值。

整数或浮点数

说明

若存在非数值数据,则会抛出异常

  • csv组件

  • igateoffline组件

  • 平台上其他数据处理组件

  • 按照平台组件开发的自定义组件

描述变量

用于比较案例相似度的变量,即案例特征的描述变量。

整数或浮点数

说明

若存在非数值数据,则会抛出异常

  • csv组件

  • igateoffline组件

  • 平台上其他数据处理组件

  • 按照平台组件开发的自定义组件

算法参数

参数名

参数描述

是否必填

参数默认值

参数范围

否存在描述变量

案例库中是否存在描述变量。

  • 存在

  • 不存在

案例库建模方法

案例指标优先:先基于评价变量筛选出优质案例,再基于筛选出的优质案例进行聚类;案例特性优先:先基于历史案例库聚类,再在每类中筛选出优质案例。

案例特性优先

  • 案例指标优先

  • 案例特性优先

优质案例-筛选方式

阈值:根据评价变量相对于给定阈值的大小进行删选;比例:根据评价变量数值的分布进行删选。

比例

  • 比例

  • 阈值

比例-评价标准

当‘比例-评价标准’为‘值较低部分’,且界限为40时,代表评价变量从低到高排序的前40%案例为优质案例;当‘比例-评价标准’为‘值较高部分’,且界限为60时,代表评价变量从低到高排序的后(100-60)=40%案例为优质案例;当‘比例-评价标准’为‘指定范围’,且范围上界为40,范围下界为60时,代表评价变量从低到高排序的40%-60%的案例为优质案例。

当优质案例-筛选方式为“比例”时,才需要配置。

值较低部分

  • 值较高部分

  • 值较低部分

  • 指定范围

阈值-评价标准

高于阈值:评价变量高于阈值的为优质案例;低于阈值:评价变量低于阈值的为优质案例;指定范围:评价变量取值在指定范围内则为优质案例。

当优质案例-筛选方式为“阈值”时,才需要配置。

低于阈值

  • 高于阈值

  • 低于阈值

  • 指定范围

阈值

阈值需是整数或者浮点数的形式。如不确定阈值时,可在优质案例-筛选方式选择‘百分位数’,则算法会根据数据的情况计算出一个阈值。

当阈值-评价标准为“低于阈值”或“高于阈值”时,才需要配置。

0.0

上界

上界的值需高于下界

当阈值-评价标准为“指定范围”时,才需要配置。

1.0

下界

下界的值需低于上界

当阈值-评价标准为“指定范围”时,才需要配置。

-1.0

比例界限

需大于0,且小于100

当比例-评价标准为“值较高部分”或“值较低部分”时,才需要配置。

5.0

比例上界

需大于0,且小于100。且比例上界的值应高于比例下界。

当比例-评价标准为“指定范围”时,才需要配置。

55.0

比例下界

需大于0,且小于100。且比例下界的值应低于比例上界。

当比例-评价标准为“指定范围”时,才需要配置。

45.0

权重变量

未输入权重变量时,每个描述变量的权重均为1;输入权重变量时,需输入每个描述变量对应的权重,并写成字典的形式。例:{'fea1': 1, 'fea2': 1.5},其中字典的key需与描述变量的变量名保持完全一致。

其他参数

参数名

参数描述

模型结果

可以查看建模成功后的模型评价结果或发布模型。