实时数据集是通过指标映射创建实时标签的前提条件。实时数据集通过不同的定义方式所创建的虚拟表结构。定义好实时数据集后,可以通过指标映射的方式创建实时标签。
功能概述
实时数据集可以通过不同数据来源选择不同实时数据集的定义方式。
数据来源于事件:可以将事件属性或其统计结果定义为数据集指标。如:定义“下单事件”,基于事件开发实时数据集并定义实时标签“最近1天累计消费金额”。
数据来源于表:可以将HBase、Hologres等数据源表字段解析加工后定义为数据集指标。如:通过查询HBase中交易数据定义实时数据集并开发实时标签“最近7天下单数”。
数据来源于API接口请求:可以将请求参数解析加工后定义为数据集指标。如:从三方开放平台采买数据,并定义为实时数据集指标开发实时标签。
实时数据集的加工方式不同,创建过程不同。描述说明如下:
创建方式 | 描述 |
数据来源于事件 | |
通过事件预加工方式对事件进行预加工,将加工结果作为数据集指标。 | |
数据来源于表 | |
通过计算脚本对HBase数据源表字段进行解析,定义数据集指标。 | |
通过SQL加工方式加工MySQL数据源开发数据集指标。 | |
通过SQL加工方式加工Hologres数据源开发数据集指标。 | |
通过SQL加工方式加工PostgreSQL数据源开发数据集指标。 |
文档内容是否对您有帮助?