本文为您介绍直播推荐的相关字段,帮助您构建一个全面的直播推荐系统,通过分析用户的特征、直播内容的特征以及用户对直播内容的行为,实现个性化推荐。
下表是直播推荐场景建议准备的用户表、物品表、行为表的字段,字段越完善越丰富,推荐效果会越好。 如能提供下表中没有涵盖到的特征字段,可以在后面追加字段。不要求字段名称与下面表格中的字段名称完全一致。
用户侧(用户表)
字段名称 | 类型 | 是否必选 | 说明 |
user_id | 整数/字符串 | 是 | 用户的ID,用户的唯一标识符。 |
age | 整数 | 否 | 用户的年龄,可以进行分段处理。 例如,0~12,12~18,18~24,25~34等,作为数值特征,离散化之后作为类别特征。 |
gender | 字符串 | 否 | 用户的性别。 例如,男、女或其他,作为类别特征。 |
occupation | 字符串 | 否 | 用户的职业信息,作为类别特征。 |
education | 字符串 | 否 | 用户的教育背景。 例如,高中、本科、硕士等,作为类别特征。 |
income | 整数/字符串 | 否 | 用户的收入水平。 例如,低、中、高,作为类别特征。 |
user_level | 整数/字符串 | 否 | 用户在平台上的等级或会员等级。 |
register_time | 时间戳 | 否 | 用户注册账户的时间,单位是秒。可以转换后按年、月、日分段,作为数值特征,离散化之后作为类别特征。 |
country | 字符串 | 否 | 用户所在国家,作为类别特征。 |
province | 字符串 | 否 | 用户所在国家的省,作为类别特征。 |
city | 字符串 | 否 | 用户所在国家的城市,作为类别特征。 |
active_time | 整数/字符串 | 否 | 用户在平台上的活跃时间段。 例如,早晨、下午、晚上等,作为类别特征。 |
device_type | 字符串 | 否 | 用户使用的设备类型。 例如,PC、手机、平板等,作为类别特征。 |
os | 字符串 | 否 | 用户设备上的操作系统,作为类别特征。 |
browser | 字符串 | 否 | 用户使用的浏览器类型,作为类别特征。 |
language | 字符串 | 否 | 用户偏好的语言,作为类别特征。 |
interests | 字符串 | 否 | 用户的兴趣点,作为Tag特征。 |
物品侧(主播表)
字段名称 | 类型 | 是否必选 | 说明 |
anchor_id | 整数/字符串 | 是 | 物品ID,主播的唯一标识符。 |
name | 字符串 | 否 | 主播的姓名。 |
nickname | 字符串 | 否 | 主播的昵称,一般会显示在直播页面。 |
anchor_gender | 字符串/数值 | 否 | 用户的性别。 例如,男、女或其他,作为类别特征。 |
language | 字符串 | 否 | 主播在直播过程中使用的语言。 包含汉语、英语、日语等。 |
level | 整数 | 否 | 关于该主播在平台的等级。 |
category | 字符串 | 否 | 主播所属的主要类别。 例如,才艺表演、游戏解说等,作为类别特征。 |
leaf_category | 字符串 | 否 | 更加细分的类别标签,作为类别特征。 |
rating | 浮点数 | 否 | 观众对主播的整体评价分数,可以转化为好评、中评、差评等形式,作为类别特征。 |
status | 数值 | 否 | 表示主播当前的状态,比如是否正在直播。 |
review_count | 整数 | 否 | 关于该主播的所有评论总数。 |
video_type | 字符串 | 否 | 直播的具体形式。 例如,现场直播、录制回放等。 |
duration | 整数 | 否 | 单次直播的持续时间长度。 |
release_date | 日期 | 否 | 直播开始的确切日期。 |
director | 字符串 | 否 | 如果是预录节目,则记录导演名字;否则通常为空。 |
actors | 字符串 | 否 | 参与直播的嘉宾名单。 |
subtitles | 布尔 | 否 | 是否提供了字幕服务。 |
region | 字符串 | 否 | 主播所在的地区。 |
tags | 字符串 | 否 | 与直播主题相关的关键词列表。 |
follow_count | 整数 | 否 | 主播粉丝数量。 |
用户行为侧(用户行为日志表)
字段名称 | 类型 | 是否必选 | 说明 |
request_id | 字符串 | 是 | 请求ID,每次推荐的唯一标识符。 |
user_id | 整数/字符串 | 是 | 用户ID,执行了某项动作的用户ID。 |
item_id | 整数/字符串 | 是 | 物品ID,受到用户互动影响的主播ID。 |
event | 字符串 | 是 | 用户对视频内容的行为。 例如,曝光(exposure)、点击(click)、点赞(like)、打赏(gift)、评论(comment)等。 |
event_value | 浮点数 | 是 |
|
event_time | 时间戳 | 否 | 精确到秒的行为发生时刻。 |
ip | 字符串 | 否 | 用户的IP地址,可以通过IP定位得到所在省、城市特征。 |
rating | 浮点数 | 否 | 用户给予主播的星级评价或其他形式的反馈。 |
scene | 字符串 | 否 | 区分不同访问入口。 例如,首页推荐、搜索结果页等。 |
device_type | 字符串 | 否 | 用户进行互动时所使用的终端设备。 |
browser | 字符串 | 否 | 用户访问时使用的浏览器软件。 |
mobile_brand | 字符串 | 否 | 用户移动设备的品牌名称。 |
os | 字符串 | 否 | 用户设备上的操作系统。 |
weather | 字符串 | 否 | 根据IP定位获取的实时天气情况。 |
holiday | 布尔 | 否 | 用户行为发生时是否是节假日。 |
season | 字符串 | 否 | 当前的季节。 |
longitude | 浮点数 | 否 | 用户所在位置的经度。 |
latitude | 浮点数 | 否 | 用户所在位置的纬度。 |