工艺模式建模

本文为您介绍工艺模式建模组件。

功能说明

工艺模式建模将根据描述变量对案例进行分类,识别不同的状态。然后针对每个状态,找到最可靠的推荐变量,保证评价变量符合预期。

计算逻辑原理

工艺模式建模是基于庞大的历史优质案例,每个案例具有描述变量,评价变量和推荐变量。

  • 描述变量:描述生产工况的参数,比如原料质检结果,环境温度等。

  • 评价变量:描述生产的结果,比如产品质量、生产能耗等。

  • 推荐变量:执行的生产参数,比如设备的温度,压力等。

算法首先会使用历史数据构造案例库。存在描述变量时,有两种案例库建模方法。第一种是‘案例指标优先’,第二种为‘案例特征优先’。

案例指标优先

  • 适用场景:历史案例包含多类别且优劣案例分布无显著差异,或所有案例属于同类。

  • 优点:计算量小,运行速度快。

  • 缺点:存在多类案例且每类案例评价变量的分布存在显著差异时,无法保障每类的案例被均匀选入。因该建模方法优先筛选出满足条件的案例的这一步骤,会造成评价指标更优的一类案例被大量选入案例库。

案例特征优先

  • 适用场景:历史案例包含多类别且不同类别中优劣案例的分布相差很大。

  • 优点:每类案例被均匀选入。

  • 缺点:适用的场景较为局限。

不存在描述变量时,案例库的建模方式即基于全部的历史案例筛选出满足条件的案例构成优质案例库。

参数说明

IN端口

参数名

参数描述

是否必填

输入数据类型

数据源类型

评价变量

根据评价变量来筛选优质案例。目前算法仅支持有且仅有一个评价变量的情况。

整数或浮点数

说明

若存在非数值数据,则会抛出异常。

  • CSV组件。

  • IGateOffline组件。

  • 平台上其他数据处理组件。

  • 按照平台组件开发的自定义组件。

推荐变量

希望通过优质案例重用得到推荐变量对应的值。

整数或浮点数

说明

若存在非数值数据,则会抛出异常。

  • CSV组件。

  • IGateOffline组件。

  • 平台上其他数据处理组件。

  • 按照平台组件开发的自定义组件。

描述变量

用于比较案例相似度的变量,即案例特征的描述变量。

当存在描述变量时才需要配置。

整数或浮点数

说明

若存在非数值数据,则会抛出异常。

  • CSV组件。

  • IGateOffline组件。

  • 平台上其他数据处理组件。

  • 按照平台组件开发的自定义组件。

算法参数

参数名

参数描述

是否必填

参数默认值

参数范围

是否存在描述变量

案例库中是否存在描述变量。

不存在

  • 存在

  • 不存在

优质案例-筛选方式

阈值:根据评价变量相对于给定阈值的大小进行筛选。

比例:根据评价变量数值的分布进行筛选。

比例

  • 比例

  • 阈值

是否存在描述变量:存在

参数名

参数描述

是否必填

参数默认值

参数范围

案例库建模方法

案例指标优先:先基于评价变量筛选出优质案例,再基于筛选出的优质案例进行聚类。

案例特性优先:先基于历史案例库聚类,再在每类中筛选出优质案例。

案例特性优先

  • 案例指标优先

  • 案例特性优先

模式类别数

输入期望的模式类别个数。缺省状态,算法会自动确定。

/

[1,99999999]

权重变量

未输入权重变量时,每个描述变量的权重均为1;输入权重变量时,需输入每个描述变量对应的权重,并写成字典的形式。例:{'fea1': 1, 'fea2': 1.5},其中字典的key需与描述变量的变量名保持完全一致。

/

优质案例-筛选方式:比例

参数名

参数描述

是否必填

参数默认值

参数范围

比例-评价标准

值较低部分:界限为40时,表示评价变量从低到高排序的前40%案例为优质案例;

值较高部分:界限为60时,表示评价变量从低到高排序的后100-60=40%案例为优质案例。

指定范围:比例上界为60,比例下界为40时,表示评价变量从低到高排序的40%-60%的案例为优质案例。

值较低部分

  • 值较高部分

  • 值较低部分

  • 指定范围

比例-评价标准:值较高部分、值较低部分

参数名

参数描述

是否必填

参数默认值

参数范围

比例界限

优质案例筛选的比例界限百分比。默认5,表示5%。

5.0

(0,100)

比例-评价标准:指定范围

参数名

参数描述

是否必填

参数默认值

参数范围

比例上界

优质案例筛选的比例上限百分比。比例上界的值应高于比例下界。默认55,表示55%。

55.0

(0,100)

比例下界

优质案例筛选的比例下限百分比。比例下界的值应低于比例上界。默认45,表示45%。

45.0

(0,100)

优质案例-筛选方式:阈值

参数名

参数描述

是否必填

参数默认值

参数范围

阈值-评价标准

高于阈值:评价变量高于阈值的为优质案例。

低于阈值:评价变量低于阈值的为优质案例。

指定范围:评价变量在指定范围内的为优质案例。

低于阈值

  • 高于阈值

  • 低于阈值

  • 指定范围

阈值-评价标准:高于阈值、低于阈值

参数名

参数描述

是否必填

参数默认值

参数范围

阈值

优质案例筛选的阈值。如不确定阈值时,可在优质案例-筛选方式选择‘百分位数’,则算法会根据数据的情况计算出一个阈值。

0.0

[-99999999,99999999]

阈值-评价标准:指定范围

参数名

参数描述

是否必填

参数默认值

参数范围

上界

优质案例筛选的上限。上界的值需高于下界。

1.0

[-99999999,99999999]

下界

优质案例筛选的下限。下界的值需低于上界。

-1.0

[-99999999,99999999]

其他参数

参数名

参数描述

模型结果

可以查看建模成功后的模型评价结果或发布模型。