全部产品
云市场

控制优化引擎

更新时间:2019-03-20 16:09:17

控制优化引擎是AI创作间用于解决生产过程控制优化类任务的一种通用算法引擎,可帮助AI创作者快速生成面向各种工业场景的控制优化算法服务。该引擎结合了传统反馈控制方法与前沿人工智能技术,具有较好的自适应优化能力,可极大提升工业控制优化类项目的实施效果。

引擎使用场景

引擎适用于工业连续生产过程中的控制与优化场景,比如:工业锅炉燃烧优化、化工行业的精馏塔能耗优化、水泥行业的立磨与回转窑能耗优化、钢铁行业的热轧加热炉能耗优化等。

引擎工作基本原理

控制优化类任务,包括训练与优化两个过程。训练过程基于历史数据建立控制优化模型,优化过程将训练出来的控制优化模型发布成控制优化服务。

引擎配置说明

训练过程

训练过程分为变量配置与参数配置两部分。

变量配置

变量类型分为状态变量、目标变量、动作变量、时间变量。变量配置参数下图:

  • 状态变量:是指重要的一些可测量的重要状态变量。
  • 目标变量:是指需要控制或优化的具体目标。
  • 动作变量:是指在实际问题中可进行调节的操作变量(即引擎将要控制的实际变量)。
  • 时间变量:用于指定训练过程离线数据表中的时间字段。

参数配置

参数配置主要包含变量参数配置与算法参数配置两项。

  • 变量参数配置说明如下表:

    参数描述
    可调范围在实际控制中,动作变量输出的上下限范围。
    采样周期主要应用于训练过程。如果在数据预处理阶段,已将训练数据进行了时间排序,并时按照相同的时间间隔进行了采样,则可以不配置该字段。如果原始训练数据没有进行排序,且相邻数据的时间间隔不相同,则需要配置该输入下的采样周期(单位为s)参数,算法会按照这个时间间隔进行重采样并求平均。
  • 算法参数配置说明如下表:

    参数描述
    目标回报包括比例系数与折扣因子两个参数,两个参数的取值范围为0~1。
    策略网络主要用于配置策略网络参数,包括网络隐含层层数与各层节点个数,网络学习率,L2正则化系数。
    评价网络主要用于配置评价网络参数,包括网络隐含层层数与各层节点个数,网络学习率,L2正则化系数。
    经验池经验池用于保存最近一段时间内的历史数据,以用于实现算法的在线学习。

优化过程

优化过程分为变量配置与参数配置两部分。

变量配置

与训练过程相比,变量配置不包含时间变量,其他三类变量的配置方式与训练过程保持一致。

参数配置

参数配置主要包含变量参数配置与算法参数配置两项。

  • 变量参数配置说明如下表:

    参数描述
    标准差该变量在历史数据中的,统计出的标准差。
    平均值该变量在历史数据中的,统计出的平均值。
    最小值该变量在历史数据中的,数据范围的最小值。
    最大值该变量在历史数据中的,数据范围的最大值。
    可调范围在实际控制中,动作变量输出的上下限范围。
    调节步长在实际控制中,动作变量输出值与当前实际值的绝对偏差的范围。
  • 算法参数配置说明如下表:

    参数描述
    选择模型用于选择已训练完成的控制优化模型,仅适用于优化过程。
    算法类型选择控制优化算法类型,目前包括智能优化、随机优化、单变量控制。
    目标回报包括比例系数与折扣因子两个参数,两个参数的取值范围为0~1。
    策略网络主要用于配置策略网络参数,包括网络隐含层层数与各层节点个数,网络学习率,L2正则化系数。
    评价网络主要用于配置评价网络参数,包括网络隐含层层数与各层节点个数,网络学习率,L2正则化系数。
    经验池经验池用于保存最近一段时间内的历史数据,以用于实现算法的在线学习。
    探索策略在线控制优化时,配置是否进行探索。目前探索策略包括高斯噪声探索和OU噪声探索。

引擎使用注意的问题

  • 训练过程只需要配置目标变量、时间变量参数,优化过程需要配置状态变量、动作变量、目标变量。
  • 在进行算法配置前,首先需要在算法配置页面左上角选择算法版本号,版本号确定后,再进行配置。