直播推荐

本文为您介绍直播推荐的相关字段,帮助您构建一个全面的直播推荐系统,通过分析用户的特征、直播内容的特征以及用户对直播内容的行为,实现个性化推荐。

说明

下表是直播推荐场景建议准备的用户表、物品表、行为表的字段,字段越完善越丰富,推荐效果会越好。 如能提供下表中没有涵盖到的特征字段,可以在后面追加字段。不要求字段名称与下面表格中的字段名称完全一致。

用户侧(用户表)

字段名称

类型

是否必选

说明

user_id

整数/字符串

用户的ID,用户的唯一标识符。

age

整数

用户的年龄,可以进行分段处理。

例如,0~12,12~18,18~24,25~34等,作为数值特征,离散化之后作为类别特征。

gender

字符串

用户的性别。

例如,男、女或其他,作为类别特征。

occupation

字符串

用户的职业信息,作为类别特征。

education

字符串

用户的教育背景。

例如,高中、本科、硕士等,作为类别特征。

income

整数/字符串

用户的收入水平。

例如,低、中、高,作为类别特征。

user_level

整数/字符串

用户在平台上的等级或会员等级。

register_time

时间戳

用户注册账户的时间,单位是秒。可以转换后按年、月、日分段,作为数值特征,离散化之后作为类别特征。

country

字符串

用户所在国家,作为类别特征。

province

字符串

用户所在国家的省,作为类别特征。

city

字符串

用户所在国家的城市,作为类别特征。

active_time

整数/字符串

用户在平台上的活跃时间段。

例如,早晨、下午、晚上等,作为类别特征。

device_type

字符串

用户使用的设备类型。

例如,PC、手机、平板等,作为类别特征。

os

字符串

用户设备上的操作系统,作为类别特征。

browser

字符串

用户使用的浏览器类型,作为类别特征。

language

字符串

用户偏好的语言,作为类别特征。

interests

字符串

用户的兴趣点,作为Tag特征。

物品侧(主播表)

字段名称

类型

是否必选

说明

anchor_id

整数/字符串

物品ID,主播的唯一标识符。

name

字符串

主播的姓名。

nickname

字符串

主播的昵称,一般会显示在直播页面。

anchor_gender

字符串/数值

用户的性别。

例如,男、女或其他,作为类别特征。

language

字符串

主播在直播过程中使用的语言。

包含汉语、英语、日语等。

level

整数

关于该主播在平台的等级。

category

字符串

主播所属的主要类别。

例如,才艺表演、游戏解说等,作为类别特征。

leaf_category

字符串

更加细分的类别标签,作为类别特征。

rating

浮点数

观众对主播的整体评价分数,可以转化为好评、中评、差评等形式,作为类别特征。

status

数值

表示主播当前的状态,比如是否正在直播。

review_count

整数

关于该主播的所有评论总数。

video_type

字符串

直播的具体形式。

例如,现场直播、录制回放等。

duration

整数

单次直播的持续时间长度。

release_date

日期

直播开始的确切日期。

director

字符串

如果是预录节目,则记录导演名字;否则通常为空。

actors

字符串

参与直播的嘉宾名单。

subtitles

布尔

是否提供了字幕服务。

region

字符串

主播所在的地区。

tags

字符串

与直播主题相关的关键词列表。

follow_count

整数

主播粉丝数量。

用户行为侧(用户行为日志表)

字段名称

类型

是否必选

说明

request_id

字符串

请求ID,每次推荐的唯一标识符。

user_id

整数/字符串

用户ID,执行了某项动作的用户ID。

item_id

整数/字符串

物品ID,受到用户互动影响的主播ID。

event

字符串

用户对视频内容的行为。

例如,曝光(exposure)、点击(click)、点赞(like)、打赏(gift)、评论(comment)等。

event_value

浮点数

  • 当event为打赏时,记录具体金额。

  • 当event为点赞时,记录点赞次数。

event_time

时间戳

精确到秒的行为发生时刻。

ip

字符串

用户的IP地址,可以通过IP定位得到所在省、城市特征。

rating

浮点数

用户给予主播的星级评价或其他形式的反馈。

scene

字符串

区分不同访问入口。

例如,首页推荐、搜索结果页等。

device_type

字符串

用户进行互动时所使用的终端设备。

browser

字符串

用户访问时使用的浏览器软件。

mobile_brand

字符串

用户移动设备的品牌名称。

os

字符串

用户设备上的操作系统。

weather

字符串

根据IP定位获取的实时天气情况。

holiday

布尔

用户行为发生时是否是节假日。

season

字符串

当前的季节。

longitude

浮点数

用户所在位置的经度。

latitude

浮点数

用户所在位置的纬度。