本文统计分组算子的使用方法及注意事项。
用途
统计分组算子可以将请求对象持久化,然后按照设置对已持久化的数据进行聚合计算。
适用场景
计算链路 | 计算引擎 | 是否支持 |
离线 | MaxCompute | 是 |
Hive | 是 | |
HiveStorage | 是 | |
RDS/MySQL | 是 | |
Spark | 是 |
使用说明
分组字段
分组字段是指需要分组的字段,用户可以选择一个或多个字段作为分组条件;可选配置,可不配置。一旦选择为分组字段后,算子将会本次请求中的字段值和历史请求数据进行分组。例如:选择“性别”作为分组字段,则算子会使用性别字段分组,分成 “男”、“女”、“”。
统计项
统计项是对经过统计范围筛选后的数据进行分组聚合操作。统计项支持表达式计算。
说明
用户可以一次配置多个统计项。
统计范围
配置统计的筛选条件。统计分组算子不会对于不符合条件的请求数据进行聚合。统计范围支持逻辑计算及多层条件嵌套。统计条件支持表达式。
文档内容是否对您有帮助?