本文档为您介绍探索分析引擎-SaaS的配置方法。您可以通过探索分析引擎-SaaS了解数据质量、数据分布及数据的相关性情况,作为数据预处理的参考依据。

注意 探索分析引擎-SaaS只支持MaxCompute数据接入,且必须在数据字典配置中选择数据类型。

准备工作

在使用 探索分析引擎-SaaS前,您需要完成以下步骤:
  1. 添加MaxCompute云计算资源
  2. 配置知识图谱数据字典
    注意 配置过程中,必须选择字段的数据类型。
  3. MaxCompute数据接入
  4. 配置知识图谱数据映射,示例如下。

使用探索分析引擎-SaaS

  1. 在工业大脑AI创作间的数据链路配置页面,选择左侧算法模块中的探索分析引擎-SaaS组件,拖入到算法配置区域。
  2. 单击探索分析引擎-SaaS组件,进入组件配置页面。

    组件分为左侧和右侧两部分,左侧为数据对象和数据筛选配置区,右侧为数据探索分析配置区。

  3. 配置数据对象。
    单击 数据对象下拉框,选择需要分析的数据对象。
    说明 列表中只会显示MaxCompute类型的数据对象。
  4. 配置数据筛选。
    说明 此步骤为可选,如果未配置数据筛选,系统会使用全量数据进行分析。
    1. 单击添加,勾选需要筛选的字段,单击>,再单击确定

    2. 筛选字段添加成功后,需要配置各字段的取值范围,配置完成后,系统将筛选出在取值范围内的数据行。此时,系统只在所筛选出的数据行范围内进行探索分析。

    3. 如果您想清除当前所配置的数据筛选字段,可单击数据筛选右侧的号,勾选需要清除的字段,单击 >,再单击确定即可。

  5. 数据探索分析配置。

    1. 根据您的需求,单击选择需要分析的类型,包括单变量二元三元关键因素识别以及关键模式挖掘分析
    2. 进行变量配置。

      单击下拉框,选择需要分析的变量。

    3. 单击运行,查看运行结果。

单变量

选择一个变量,单击 运行,进行分析,完成后可查看运行结果。

说明 可以选择任何类型的变量,对于NUMERIC类型的数据,系统会显示箱线图和直方图,其他类型的数据,系统只显示直方图。

二元

分别选择 X轴变量Y轴变量,单击 运行,进行分析,完成后可查看运行结果。

说明 X轴变量支持任何类型的变量, Y轴变量不支持DATETIME类型的变量。

三元

分别选择 X轴变量Y轴变量分组变量,单击 运行,进行分析,完成后可查看运行结果。

说明 X轴变量支持任何类型的变量, Y轴变量只支持NUMERIC类型的变量, 分组变量只支持CATEGORY类型的变量。

关键因素识别

分别选择 目标变量因素变量,单击 运行,进行分析,完成后可查看运行结果。

说明
  • 只能选择一个目标变量,可以选择多个因素变量,因素变量里面不能包含目标变量。
  • 当目标变量为NUMERIC类型时,可以选择是否对目标变量进行离散化分析。

    • 如果选择,需要指定变量的取值范围,取值范围需要在变量的最大值和最小值之间。可通过单变量分析结果中的直方图,查看目标变量值的分布情况,确定取值范围。
    • 如果选择,不需要做任何处理。

关键模式挖掘

分别选择 目标变量因素变量,单击 运行,进行分析,完成后可查看运行结果。

说明
  • 只能选择一个目标变量,可以选择多个因素变量,因素变量里面不能包含目标变量。
  • 当目标变量为NUMERIC类型时,可以选择是否对目标变量进行离散化分析。

    • 如果选择,需要指定变量的取值范围,取值范围需要在变量的最大值和最小值之间。可通过单变量分析结果中的直方图,查看目标变量值的分布情况,确定取值范围。
    • 如果选择,不需要做任何处理。