编辑: 静看花开花落 2019-07-05

1 中的收视回看信息及点播信息中的用户行为, 分析用户的收视偏 好.例如喜欢看哪一类的节目,家中成员有哪些,然后为附件

2 的产品进行分类 打包推荐. 问题二:相似用户的电视产品打包推荐 构建用户标签体系和产品标签体系,对相似偏好用户进行分类,为用户贴上 标签;

对产品进行分类,为产品推荐标签;

为每一位用户生成个性化的产品营销 推荐方案. 1.3 问题分析 针对问题一,通过观察发现,附件

1 中的四个子表格中,表

1、表2是用户 频道数据,表

3、表4,是用户节目数据,所以可以对其分为两类进行处理. (1)对于表

1、表2,首先分别计算用户对于每个频道的观看频率,然后对时 间数据进行加权, 最后整合得到初始数据. 其次, 利用协同过滤的 userCF 算法, 得到用户间的相似度矩阵. (2)对于表

3、表4,先对节目进行预处理.对于点播金额和观看时间分别加 权,计算用户观看节目的总频率表.然后采用 itemCF 算法,得到每个节目间的 相似度矩阵. (3)根据节目相似度,计算点播用户的节目推荐列表,再根据用户相似度, 计算未点播用户的相似推荐列表 针对问题二,需要为用户推荐节目观看类型标签,进行用户画像,所以要先 构建用户及产品标签体系.具体的求解步骤如下: (1)用附件

2 构建产品标签体系及用户标签体系,得到产品数据标签,并对 标签进行编号. (2)用附件

3 计算入网时长,为用户贴上新老用户标签. (3)用附件

1 计算每个用户在每个时间段的观看频率,找出频率排名最高的 时间段,删除在时间上无明显偏好的用户,为用户贴上时间偏好标签. (4) 结合附件

2 整理得到的数据与用户相似度矩阵, 得到用户数据标签列表, 以及用户标签推荐列表.

2 模型假设 (1)假设用户观看或回看时长不足

5 分钟的数据,为无效数据 (2)假设时间段观看的最高频率小于 0.5 的用户,为无明显偏好用户 (3)假设用户的偏好不改变

3 符号说明 符号 定义 时间频率 该用户观看该节目的总时间 该用户观看节目的总时间 观看频率 回看频率 回看总频率 收视频率 单片点播频率 单片点播总频率 点播频率 点播总频率 将收视频率和回看频率整合在一起的频率 将单片点播频率与单片点播总频率整合在一起的频率 该用户观看节目的总次数 该用户观看该节目的总次数 点播金额比例 该用户观看该节目总金额 该用户观看节目总金额 该用户在该节目点播总次数 该用户点播节目总次数 表示某个用户 喜欢物品?的用户数 是喜欢物品?的用户数 同时喜欢物品?和物品?的用户数 用户?对物品?的兴趣 用户喜欢的物品集合 和物品?最相似的?个物品集合 物品?和?的相似度 用户?对物品?的兴趣 推荐系数 相似度 点播用户观看得节目的最高的频率

4 基于 userCF 算法的用户节目推荐 4.1 思路分析 通过观察发现,附件

1 中的四个表中,分别有用户和频道数据、用户和节目 数据,两类数据.对于表

1、表2,先分别计算各自的观看频率,然后进行整合, 利用协同过滤的 userCF 算法,计算用户间的相似度矩阵.对于表

3、表4,先对 节目进行预处理,计算用户观看节目的总频率表,运用 itemCF 算法,计算节目 相似度.根据节目相似度,计算点播用户的节目推荐列表,再根据用户相似度, 计算未点播用户的相似推荐列表,然后同理计算附件 2,得到总的节目推荐表, 其思维导图如下图 4-1: 图4-1 思维导图 注:表1指用户收视信息表,表2指用户回看信息表,表3指用户点播信息 表,表4指用户单片点播信息表. 4.2 整理数据 4.2.1 用户和频道信息数据处理 观察原始数据发现附件

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题