全部产品

推荐模板

更新时间:2017-09-07 10:11:13   分享:   

如您希望了解关于行业模板的更多信息,欢迎您咨询顾问

新媒体推荐模板

介绍

新媒体推荐模板是推荐引擎针对新媒体客户业务需求推出的一站式推荐算法解决方案,提供个性化的新闻、短视频和图文混合推荐。新用户也能够享受到实时推荐,新发生的新闻也能够实时推荐出去,为您解决海量新闻精准曝光的问题。

支持的推荐场景:

  • 首页综合推荐
  • 首页新闻推荐
  • 首页视频推荐
  • 首页图文推荐
  • 详情页新闻推荐
  • 详情页视频推荐
  • 详情页图文推荐

支持的数据:

  • 用户数据
  • 物品数据,包括新闻表、视频表和图集表
  • 行为数据

使用方式

1 开通推荐模板服务,您可以先进行模板试用,或者直接购买推荐模板。

BUYTPL

2 创建模板业务:在“推荐模板”页,选中新媒体推荐模板,并根据页面指引创建业务。

3 配置业务所需数据。

DC

推荐引擎提供测试数据样例,在数据源中选择“推荐自带计算资源”,数据表对应关系如下:

  • 新闻表:toutiao_dim_news
  • 视频表:toutiao_dim_video
  • 行为表:toutiao_user_hbv

4 在测试环境中,系统已经预先为每个场景配置好API入参、算法策略和在线流程,您可直接为推荐场景启动算法计算。

5 计算任务完成后,在测试环境下的场景列表中点击“上线”,就可以将测试环境中的场景发布到线上环境中。

6 在线上环境的场景列表中,选中场景后再点击右侧“API调试”,可以在API调试页面来测试推荐API获取的推荐结果。API请求地址包含了您调用API的URL和认证参数,您可以使用其和您的业务系统。

新媒体推荐模板-数据格式规范

用户维度表(DIM_USER)

字段描述

列名 数据类型 注释 可否为NULL
user_id string 用户ID,可以是AID、device id、淘宝ID等各种唯一标识用户身份的ID。不能出现(\001-\003)特殊字符。以下user_id字段同此义。
tags string 用户标签信息,JSON格式【注释1】
plates string 板块区分字段,多个板块code用逗号分隔【注释3】
update_datetime datetime 系统录入时间,用于做相同user_id的按最新时间去重

ODPS DDL示例

  1. CREATE TABLE IF NOT EXISTS dim_user (
  2. user_id STRING,
  3. tags STRING,
  4. plates STRING,
  5. update_datetime DATETIME
  6. ) COMMENT '用户维度表'
  7. LIFECYCLE 360;

ODPS SQL示例

  1. INSERT OVERWRITE TABLE dim_user
  2. SELECT 'u1' AS user_id
  3. , '{"age":18,"gender":"male","interest":["sport","book","movie"]}' AS tags
  4. , null, getdate()
  5. FROM dual;

资讯维度表(DIM_NEWS)

字段描述

列名 数据类型 注释 可否为NULL
item_id string 资讯全局唯一标识。
ttl bigint 资讯存活时间,单位为天,从系统入库时间开始经过ttl天后将认为不再可推荐。设置为NULL或负数表示不过期。
enabled bigint 是否可被推荐,取值为1表示可推荐,0表示不可推荐。
category string 资讯所属类目,如体育、影视等。注:一条咨询只能配置单个类目。
source string 资讯来源,比如作者、发布人、来源站点,可用于计算物品来源质量。注:一条咨询只能配置单个来源。
text_tags string 资讯的文本tag属性,可以为关键字、运营/UGC标签、资讯内包含的用户话题等,多个tag之间用分号隔开。
title string 资讯标题。
abstract string 资讯摘要信息,如没有可不提供,置为NULL即可。
content string 资讯正文全文。
class string 推荐时用于对资讯进行分类筛选的属性,多个属性之间用分号隔开。如推荐时希望一个重庆美食资讯可以同时出现在“美食”、“重庆”分类下,则填入”美食;重庆”。
plates string 【可选字段】如提供该字段,需要固定取值为”news”。【注释0】
update_datetime datetime 系统录入时间,用于做去重。
item_info string 【可选字段】物品的业务元信息,主要为在客户端展现用,可在API请求时返回,不用于离线推荐计算。
properties string 【可选字段】可用于表征物品相似度的其他属性集合(上述字段除外),只识别“单值枚举”和“多值枚举”两种类型。【注释1】

ODPS DDL示例

  1. CREATE TABLE IF NOT EXISTS dim_news (
  2. item_id STRING,
  3. ttl BIGINT,
  4. enabled BIGINT,
  5. category STRING,
  6. source STRING,
  7. text_tags STRING,
  8. title STRING,
  9. abstract STRING,
  10. content STRING,
  11. class STRING,
  12. plates STRING,
  13. update_datetime DATETIME,
  14. item_info STRING,
  15. properties STRING
  16. ) COMMENT '资讯维度表'
  17. LIFECYCLE 360;

ODPS SQL示例

  1. INSERT OVERWRITE TABLE dim_news
  2. SELECT 'news1' AS item_id
  3. , 30 AS ttl
  4. , 1 as enabled
  5. , 'sport' as category,
  6. , 'cctv' as source,
  7. , 'C罗;金球奖;足球先生;皇马' as text_tags,
  8. , 'C罗荣获第五座金球奖' as title
  9. , '欧足联年度最佳球员奖项正式揭晓,皇马当家球星C罗当选,这是葡萄牙领袖第三次获评该奖项,他曾获选2013-2014以及2015-2016的最佳球员。' as abstract
  10. , '正文全文,此处省略' as content,
  11. , '足球;C罗' as class
  12. , 'news' as plates
  13. , getdate() as update_datetime
  14. , null as item_info
  15. , '{"专题":"2017金球奖专题报道","栏目":["国际足坛","欧洲足球","金球奖"]}' as properties
  16. FROM dual;

视频维度表(DIM_VIDEO)

字段描述

列名 数据类型 注释 可否为NULL
item_id string 视频全局唯一标识。
ttl bigint 视频存活时间,单位为天,从系统入库时间开始经过ttl天后将认为不再可推荐。设置为NULL或负数表示不过期。
enabled bigint 是否可被推荐,取值为1表示可推荐,0表示不可推荐。
category string 视频所属类目,如体育、影视等。注:一条咨询只能配置单个类目。
source string 视频来源,比如作者、发布人、来源站点,可用于计算物品来源质量。注:一条咨询只能配置单个来源。
length bigint 视频长度,单位为秒
size bigint 视频大小,单位为字节
resolution string 视频分辨率
topics string 视频所属栏目,如一个美妆教学视频可以同时属于“美妆”、“达人”栏目,一个搞笑视频可以同时属于“搞笑视频”、“开心一刻”、“热点视频”等栏目
text_tags string 视频的文本tag属性,可以为关键字、运营/UGC标签、资讯内包含的用户话题等,多个tag之间用分号隔开。
title string 视频标题。
description string 视频描述文本信息
class string 推荐时用于对视频进行分类筛选的属性,多个属性之间用分号隔开。如推荐时希望一个重庆美食视频可以同时出现在“美食”、“重庆”分类下,则填入”美食;重庆”。
plates string 【可选字段】如提供该字段,需要固定取值为”video”。【注释0】
update_datetime datetime 系统录入时间,用于做去重。
item_info string 【可选字段】物品的业务元信息,主要为在客户端展现用,可在API请求时返回,不用于离线推荐计算。
properties string 【可选字段】可用于表征物品相似度的其他属性集合(上述字段除外),只识别“单值枚举”和“多值枚举”两种类型。【注释1】

ODPS DDL示例

  1. CREATE TABLE IF NOT EXISTS dim_video (
  2. item_id STRING,
  3. ttl BIGINT,
  4. enabled BIGINT,
  5. category STRING,
  6. source STRING,
  7. length BIGINT,
  8. size BIGINT,
  9. resolution STRING,
  10. topics STRING,
  11. text_tags STRING,
  12. title STRING,
  13. description STRING,
  14. class STRING,
  15. plates STRING,
  16. update_datetime DATETIME,
  17. item_info STRING,
  18. properties STRING
  19. ) COMMENT '视频维度表'
  20. LIFECYCLE 360;

ODPS SQL示例

  1. INSERT OVERWRITE TABLE dim_video
  2. SELECT 'video1' AS item_id
  3. , 30 AS ttl
  4. , 1 as enabled
  5. , 'sport' as category,
  6. , 'cctv' as source,
  7. , 180 as length
  8. , 2097152 as size
  9. , '512*512' as resolution
  10. , 'C罗;金球奖;足球先生;皇马' as text_tags,
  11. , 'C罗荣获第五座金球奖' as title
  12. , '欧足联年度最佳球员奖项正式揭晓,皇马当家球星C罗当选,这是葡萄牙领袖第三次获评该奖项,他曾获选2013-2014以及2015-2016的最佳球员。' as description
  13. , '足球;C罗' as class
  14. , 'video' as plates
  15. , getdate() as update_datetime
  16. , null as item_info
  17. , '{"专题":"2017金球奖专题报道","栏目":["国际足坛","欧洲足球","金球奖"]}' as properties
  18. FROM dual;

字段描述

列名 数据类型 注释 可否为NULL
item_id string 图集全局唯一标识。
ttl bigint 图集存活时间,单位为天,从系统入库时间开始经过ttl天后将认为不再可推荐。设置为NULL或负数表示不过期。
enabled bigint 是否可被推荐,取值为1表示可推荐,0表示不可推荐。
category string 图集所属类目,如体育、影视等。注:一条咨询只能配置单个类目。
source string 图集来源,比如作者、发布人、来源站点,可用于计算物品来源质量。注:一条咨询只能配置单个来源。
text_tags string 图集的文本tag属性,可以为关键字、运营/UGC标签、资讯内包含的用户话题等,多个tag之间用分号隔开。
title string 图集标题。
json_content string 图集内容,记录图集中每一张图片的信息,格式为[{\”img_id\”: \”[可选]图片id\”, \”desc\”:\”[必须]图片描述信息\”},{\”img_id\”:\”1\”,\”desc\”:\”desc\”}]
class string 推荐时用于对图集进行分类筛选的属性,多个属性之间用分号隔开。如推荐时希望一个重庆美食图集可以同时出现在“美食”、“重庆”分类下,则填入”美食;重庆”。
plates string 【可选字段】如提供该字段,需要固定取值为”gallery”。【注释0】
update_datetime datetime 系统录入时间,用于做去重。
item_info string 【可选字段】物品的业务元信息,主要为在客户端展现用,可在API请求时返回,不用于离线推荐计算。
properties string 【可选字段】可用于表征物品相似度的其他属性集合(上述字段除外),只识别“单值枚举”和“多值枚举”两种类型。【注释1】

ODPS DDL示例

  1. CREATE TABLE IF NOT EXISTS dim_gallery (
  2. item_id STRING,
  3. ttl BIGINT,
  4. enabled BIGINT,
  5. category STRING,
  6. source STRING,
  7. text_tags STRING,
  8. title STRING,
  9. json_content STRING,
  10. class STRING,
  11. plates STRING,
  12. update_datetime DATETIME,
  13. item_info STRING,
  14. properties STRING
  15. ) COMMENT '图集维度表'
  16. LIFECYCLE 360;

ODPS SQL示例

  1. INSERT OVERWRITE TABLE dim_gallery
  2. SELECT 'gallery1' AS item_id
  3. , 30 AS ttl
  4. , 1 as enabled
  5. , 'sport' as category,
  6. , 'cctv' as source,
  7. , 'C罗;金球奖;足球先生;皇马' as text_tags,
  8. , 'C罗荣获第五座金球奖' as title
  9. , '[{"img_id":"1","desc":"C罗登上领奖台"},{"img_id":"2","desc":"C罗接过奖杯"},{"img_id":"3","desc":"C罗发表获奖感言"}]' as json_content
  10. , '足球;C罗' as class
  11. , 'gallery' as plates
  12. , getdate() as update_datetime
  13. , null as item_info
  14. , '{"专题":"2017金球奖专题报道","栏目":["国际足坛","欧洲足球","金球奖"]}' as properties
  15. FROM dual;

行为表(USER_BEHAVIOR)

字段描述

列名 数据类型 注释 Nullable
user_id string 用户ID
act_obj string 行为对象,行为作用对象的标识。如果有ID,就用ID,如帖子的作者;如果没有ID,直接记录,如搜索关键词。
obj_type string 行为作用对象的类型,取值为
item:行为对象就是物品,这时act_obj就是item_id(一般情况下只需关注此项即可)
category:行为对象是物品的类型,这时act_obj一般都是category id
property:行为对象是物品的属性,这时要说明具体属性在properties字段中的key。这种情况下本字段格式为properties:key
keyword:行为对象是关键词,
默认为‘item’
bhv_type string 行为类型:
view:物品曝光
click:用户点击物品
collect:用户收藏了某个物品
uncollect:用户取消收藏某个物品
search_click:用户点击搜索结果中的物品
comment:用户对物品的评论
share: 分享
like:点赞
dislike:点衰
grade:评分
consume:消费
use:观看视频/听音乐/阅读
行为表记录的用户行为用于用户偏好建模
bhv_amt double 用户对物品的评分、消费、观看时长等。
bhv_cnt double 行为次数,默认为1,消费可以埋购买件数
bhv_datetime datetime 行为发生的时间,UTC格式。
content string 行为的具体内容。
comment:记录评论
search_click:记录搜索关键字
pos_type string 行为发生的位置类型,和下面position字段联合使用,有三种取值:
ll:经纬度格式的位置信息
gh:geohash格式的位置信息
poi:poi格式的位置信息
position string 行为发生的位置,根据pos_type有不同的取值格式:
如果pos_type=ll,position格式[longitude:latitude]
如果pos_type=gh,position格式[geohashcode]
如果pos_type=poi,position格式[poi_string]
env string JSON String
{
“IP”:””,
“network”:””,
“device”:””
}
IP: IP地址。行为发生时用户的IP地址。IPv4为点分十进制格式;IPv6为冒号分隔的标准6段格式(不使用IPv6嵌套IPv4的格式)
network: 网络制式。行为发生时用户所使用的接入网络,取值为solid,2G,3G,4G,WIFI。分别表示固网,2G,3G,4G和WIFI接入方式
device: 发生行为所使用的设备,包括mobile,pad,pc等,可添加
其他自定义环境变量也可以添加到JSON中
trace_id string 返回的推荐列表用于跟踪效果。如果对item_id 的行为不是来自推荐引导,则为NULL
plates string 仅obj_type=’item’时生效,固定取值范围为[news,video,gallery],物品属于多个plate时用逗号隔开,如”news,video”。【注释2】

分区描述

分区名 数据类型 注释 Nullable
ds string 分区字段,按日分区,格式yyyyMMdd。每个分区只记录当日数据,推荐引擎会保留一段时间的历史分区

ODPS DDL示例

  1. CREATE TABLE IF NOT EXISTS user_behavior (
  2. user_id STRING,
  3. act_obj STRING,
  4. obj_type STRING,
  5. bhv_type STRING,
  6. bhv_amt DOUBLE,
  7. bhv_cnt DOUBLE,
  8. bhv_datetime DATETIME,
  9. content STRING,
  10. pos_type STRING,
  11. position STRING,
  12. env STRING,
  13. trace_id STRING,
  14. plates STRING
  15. ) PARTITIONED BY (
  16. ds STRING
  17. );

ODPS SQL示例

  1. INSERT OVERWRITE TABLE user_behavior PARTITION (ds='20160101')
  2. SELECT 'u1' AS user_id
  3. , 'i1' AS act_obj
  4. , 'item' AS obj_type
  5. , 'click' AS bhv_type
  6. , 0 AS bhv_amt
  7. , 1 AS bhv_cnt
  8. , getdate() AS bhv_datetime
  9. , NULL AS content
  10. , 'll' AS pos_type
  11. , concat('74', '\002', '56') AS position
  12. , NULL AS env
  13. , NULL AS trace_id
  14. , "news,video" AS plates
  15. FROM dual;

注释0

  1. 可选字段:字段为可选指的是,提供的表结构schema中可以不包含该字段,与包含该字段但字段值置为NULL含义不同。

注释1

  1. 用户维度表的tags字段,以及资讯、视频、图文维度表的properties字段取值规范:
  2. 以标准JSON格式提供,只支持单层结构,键只识别“单值枚举”和“多值枚举”两种类型,说明如下:
  3. 单值枚举型:如性别,只能取一个值,但这个值是可以枚举的(男,女)。
  4. 多值枚举型:如用户标签,美包控、准妈妈等可以枚举,但是每个用户可以取多个,支持针对每一个枚举值指定权重。
  5. 在下面的例子中,“城市”和“性别”是单值枚举型,“标签”和“类目偏好”是多值枚举型,且“类目偏好”里的每一个取值(男装、体育用品)均带有权重信息。
  6. {
  7. "城市": '杭州',
  8. "性别": "男",
  9. "标签": [
  10. "美包控",
  11. "准妈妈"
  12. ],
  13. "类目偏好": {
  14. "男装": 0.89,
  15. "体育用品": 0.98
  16. }
  17. }

注释2

  1. 当存在不同的推荐场景中需要用不同的用户关系数据做推荐时,利用本字段进行标识。客户需要定义一组plate,为每个推荐场景分配一个plate,在本字段中记录用户可以被推荐使用的所有场景的plate id,中间以逗号分隔。
  2. 如客户定义了两个plateID分别为12。现有用户ABC,其中A只能用在plate1B只能用在plate2C可用在plate12,这时Aplates字段为1Bplates字段为2Cplate字段为1,2
本文导读目录
本文导读目录
以上内容是否对您有帮助?