全部产品
弹性计算 会员服务 网络 安全 移动云 数加·大数据分析及展现 数加·大数据应用 管理与监控 云通信 阿里云办公 培训与认证 更多
存储与CDN 数据库 域名与网站(万网) 应用服务 数加·人工智能 数加·大数据基础服务 互联网中间件 视频服务 开发者工具 解决方案 物联网 智能硬件

流量优选

更新时间:2018-04-20 13:50:58

流量优选服务介绍

流量优选服务,是结合阿里大数据及DSP真实广告日志数据进行算法建模,以识别不同Request请求背后的流量质量,向DSP提供采买流量的决策依据。您在节约流量采买成本的同时,依然能保持原有广告投放效果。

流量优选可基于IP或基于移动端设备号(IMEI/IDFA/MAC)进行模型训练和在线查询。

流量优选服务离线实验流程

Step 1. DSP进行实验数据准备

您需要提供至少1天的ADX Request全量请求,阿里云会将这份数据的随机抽样部分用于模型验证,剩余部分用于流量优选的离线模型训练。

离线数据的格式要求如下:

  • 数据格式——tsv格式,每行一条记录,字段以tab分割,字段需清洗tab键以避免字段混乱。
字段分类 字段名 字段描述 是否必需 类型 备注
#用户信息 ip 用户IP Y STRING
user_id 用户ID:IDFA/IMEI/MAC/或其它标识。 Y STRING
user_id_type 标识userid的类型是IDFA/IMEI/MAC/other,一般加密的userid,请区分开,如IDFA_MD5或IDFA_SHA1。 Y STRING 请填写值:IDFA/IMEI/MAC/IDFA_MD5/IDFA_SHA1。
#广告信息 advertiser_id 广告主 Y INT
campaign_id 营销活动 Y INT
ad_industry 广告行业 N STRING
#行为信息 request_timestamp ADX请求时间 Y INT
request_num ADX请求次数 Y INT 理论上应当恒为1,但不排除有Request回放攻击造成Request次数>1的情况。
impression_num 展示次数 Y INT
click_num 点击次数 Y INT
conver_num 转化次数 Y INT

Step 2. 阿里云进行离线模型训练

阿里云将融合您所提供的用于训练的Request数据以及阿里大数据生成流量打分模型。

Step 3. 阿里云产出离线实验报告

基于步骤2生成的模型,阿里云将结合抽样Request数据集产出实验报告。报告格式样例如下:

基于IP的流量优选实验报告:
IP得分选取阈值 曝光数 点击数 转化率
校验用数据全量IP(基线) xxxxxxx xxxxx xxx
>9900分 xxxxxxx(基线曝光数的x%) xxxxx(基线点击数的x%) xxxxxxxx(基线转化数的x%)
9800~9900分 xxxxxxx(基线曝光数的x%) xxxxx(基线点击数的x%) xxxxxxxx(基线转化数的x%)
9700~9800分 xxxxxxx(基线曝光数的x%) xxxxx(基线点击数的x%) xxxxxxxx(基线转化数的x%)
xxxxxxx(基线曝光数的x%) xxxxx(基线点击数的x%) xxxxxxxx(基线转化数的x%)
基于移动设备号的流量优选实验报告:
设备号得分选取阈值 曝光数 点击数 转化率
校验用数据全量设备号(基线) xxxxxxx xxxxx xxx
>9900分 xxxxxxx(基线曝光数的x%) xxxxx(基线点击数的x%) xxxxxxxx(基线转化数的x%)
9800~9900分 xxxxxxx(基线曝光数的x%) xxxxx(基线点击数的x%) xxxxxxxx(基线转化数的x%)
9700~9800分 xxxxxxx(基线曝光数的x%) xxxxx(基线点击数的x%) xxxxxxxx(基线转化数的x%)
xxxxxxx(基线曝光数的x%) xxxxx(基线点击数的x%) xxxxxxxx(基线转化数的x%)

除了上述报告之外,您也可以离线提供一批黑白流量混合在一起的样本集合,阿里云在并不事先预知流量黑白属性的情况下通过模型离线产出得分。您可基于阿里云对黑白流量得分排序的情况判断模型的有效性。

流量优选服务在线调用

若您对流量优选的离线效果满意,可选择长期在线调用流量优选服务。调用在线服务的前提需要您定期上报Request数据。在线服务本身可在30ms内返回结果。

本文导读目录