全部产品
存储与CDN 数据库 安全 应用服务 数加·人工智能 数加·大数据基础服务 互联网中间件 视频服务 开发者工具 解决方案 物联网 钉钉智能硬件
流计算

广告效果分析

更新时间:2017-06-07 13:26:11

问题描述

某女性电商公司为了吸引更多女性向新客户,决定在多家门户网站女性频道投放公司广告。为进一步追踪外投广告的效果并修改广告投放策略,公司决定实时对外投广告点击来源进行效果分析。业务需求是对于不同的活动页面,分类统计来源信息。

解决方案

由于涉及到广告点击日志产生源在ECS的Ngnix上,公司的数据开发人员使用Fluentd将上述日志数据采集进入DataHub,DataHub Topic定义如下:

字段名 类型 注释
click_time String 访问时间,格式为yyyy-MM-dd HH:mm:ss
from_url String 访问来源,格式为http://xxxx.xxxx.xxx/xxxx/xxxx

为最终实时展示来源效果,公司决定使用RDS进行计算结果存储,同时使用BI报表的饼状图来实时展现RDS中存储的结果:

其中RDS表定义如下:

字段名 类型 注释
ad_date varchar(16) 主键,点击日期,格式为yyyy-MM-dd
from_site varchar(128) 访问来源网站,xxxx.xxxx.xxx
from_count bigint 来源数量
  1. replace into result_rds
  2. select
  3. to_date(click_time) as ad_date, --以天为维度分析点击来源
  4. regexp_extract(from_url, 'http(s?)(://)([^/]+)(.*?)', 3) as from_site, --获取URL域名
  5. count(1) as from_count
  6. from
  7. click_stream
  8. group by
  9. to_date(click_time),
  10. regexp_extract(from_url, 'http(s?)(://)([^/]+)(.*?)', 3);
本文导读目录