实时数据集概述

实时数据集是通过指标映射创建实时标签的前提条件。实时数据集通过不同的定义方式所创建的虚拟表结构。定义好实时数据集后,可以通过指标映射的方式创建实时标签。

功能概述

image

实时数据集可以通过不同数据来源选择不同实时数据集的定义方式。

  • 数据来源于事件:可以将事件属性或其统计结果定义为数据集指标。如:定义“下单事件”,基于事件开发实时数据集并定义实时标签“最近1天累计消费金额”。

  • 数据来源于表:可以将HBase、Hologres等数据源表字段解析加工后定义为数据集指标。如:通过查询HBase中交易数据定义实时数据集并开发实时标签“最近7天下单数”。

  • 数据来源于API接口请求:可以将请求参数解析加工后定义为数据集指标。如:从三方开放平台采买数据,并定义为实时数据集指标开发实时标签。

实时数据集的加工方式不同,创建过程不同。描述说明如下:

创建方式

描述

数据来源于事件

通过事件预加工创建实时数据集

通过事件预加工方式对事件进行预加工,将加工结果作为数据集指标。

数据来源于表

通过HBase创建实时数据集

通过计算脚本对HBase数据源表字段进行解析,定义数据集指标。

通过MySQL创建实时数据集

通过SQL加工方式加工MySQL数据源开发数据集指标。

通过Hologres创建实时数据集

通过SQL加工方式加工Hologres数据源开发数据集指标。

通过PostgreSQL创建实时数据集

通过SQL加工方式加工PostgreSQL数据源开发数据集指标。