一种基于协同过滤的电视终端节目个性化推荐方法技术

技术编号:16761895 阅读:45 留言:0更新日期:2017-12-09 05:49
本发明专利技术公开了一种基于协同过滤的电视终端节目个性化推荐方法,基于物品的协同过滤技术,主要分两步进行,首先通过用户物品评分矩阵计算物品与物品之间的相似性,然后利用用户历史评分数据和物品物品相似性矩阵计算用户对其它物品的偏好,物品协同过滤技术主要利用了用户之间的集体智慧来计算物品之间的相似性,进而计算用户对物品的偏好。本发明专利技术首先针对电视端用户历史评分数据较难直接获取,构建了一种打分策略来将用户的观影行为转换为评分数据,然后利用构建的评分数据计算物品与物品相似性,最后实现推荐。

A personalized recommendation method for TV terminal programs based on collaborative filtering

The invention discloses a collaborative filtering recommendation method based on terminal TV program personalization, collaborative filtering technology based on the items, mainly divided into two steps, first by the user item rating matrix calculation between goods and goods of the similarity, and then use the user rating data and historical item similarity matrix of user preferences on other items articles, collaborative filtering technology mainly uses the collective wisdom among users to calculate the similarity between items, and then calculates the user preferences on items. Firstly, aiming at the difficulty of directly acquiring the user rating history data at the TV terminal, a scoring strategy is constructed to transform the user's viewing behavior into the score data, and then the similarity between goods and articles is calculated based on the constructed score data, and finally the recommendation is achieved.

【技术实现步骤摘要】
一种基于协同过滤的电视终端节目个性化推荐方法
本专利技术涉及大数据应用
,尤其涉及一种基于协同过滤的电视终端节目个性化推荐方法。
技术介绍
随着互联网技术的发展,人们从网络中获取到的信息量越来越大,如何从海量信息中快速获取到有效信息一直是计算机应用领域的研究热点。其中,推荐算法已经成为解决互联网环境中“信息过载”问题的重要手段。目前,推荐技术被广泛应用于电子商务、社交网络等互联网应用中,例如专利号为CN201410212505.4的专利将推荐技术引入校园图书的个性化推荐中。但是,目前很少有将这样的推荐技术应用于电视终端的案例。现如今电视节目众多,用户很难快速找到自己真正感兴趣的电视节目。在海量的电视节目面前,如何帮助电视终端用户快速找到想看的节目,已然成为电视行业的研究热点。因此,将互联网中广泛应用的推荐技术引入电视,可以帮助用户更加高效地找到观看节目。本专利正是基于电视应用的实际需求,考察电视终端容易获得的信息资源,设计合理的推荐方法,利用电视终端用户的集体协同智慧,向用户推荐他们可能需要的节目,帮助用户个性化地选择想看的节目,从而提高电视终端的使用率、终端用户留存率。
技术实现思路
针对现有技术存在的不足之处,本专利技术的目的在于提供一种基于协同过滤的电视终端节目个性化推荐方法,本专利技术首先针对电视端用户历史评分数据较难直接获取,构建了一种打分策略来将用户的观影行为转换为评分数据,然后利用构建的评分数据计算物品与物品相似性,最后实现推荐。本专利技术的目的通过下述技术方案实现:一种基于协同过滤的电视终端节目个性化推荐方法,其方法步骤如下:A、根据用户的历史观影行为构建用户-节目-评分矩阵R;从采集的观影行为中抽取最近T_day天的用户观影行为作为算法源数据,对算法源数据进行如下两步清洗处理:A1、去除过于活跃的用户:从T_day天的用户观影行为中统计所有用户的观影情况,取一定比例相对非活跃的用户参与到后续步骤B,一定比例为整个用户所占比X1;其中,活跃用户的活跃度指在T_day天的用户观影行为中统计出的单个用户观看的节目数;A2、剔除过于热门的节目:从T_day天的用户观影行为中统计所有节目被观看的情况,取一定比例相对非热门的节目参与到后续步骤B;其中,热门节目的热门度指在T_day天的用户观影行为中统计出的单个节目有多少用户观看过;经过步骤A清洗后的数据有m个用户,用户表示为user,n个节目,节目表示为item,则R表示为:式中,rui表示用户useru对节目itemi的评分;其中rui采用如下方式构建:式中,null表示用户useru未观看节目itemi,C为用户useru对节目itemi观看的总次数,T为节目itemi的总时长,tc表示用户useru每次观看节目itemi的时长,α为收缩因子,表示连乘符号;式中,是所有的集合,上式表示对构建后的评分数据进行max-min归一化处理;B、根据用户物品评分矩阵R计算节目-节目-相似性矩阵W,节目-节目-相似性矩阵W表示为:式中,wij表示节目itemi与节目itemj的相似性;取出两个节目各自观看的所有用户对其的评分,并取其中公有的用户对它们的评分来计算两个节目的相似性;具体数学化的表示如下:其中,Uij表示既观看了itemi又观看了itemj的用户,|Uij|表示既观看了itemi又观看了itemj的用户数目,表示所有观看了节目itemi的用户对节目itemi的平均评分;λ为平滑参数,为修正项;C、根据用户-节目-评分矩阵R和节目-节目-相似性矩阵W计算用户节目偏好矩阵P,偏好矩阵P表示如下:式中,pui表示算法预测出的用户useru对节目itemi的偏好;根据用户节目评分数据和节目-节目相似性矩阵W,便可以计算m个用户对所有n个节目的偏好;找到用户useru评分过的与itemi最相似的K个节目的来计算useru对itemi的偏好,具体数学化的表示如下:其中,Nu(i)表示用户评分过的节目中与itemi最接近的|Nu(i)|个用户,|Nu(i)|≤K,λ=100为平滑参数,K为最近邻个数;D、形成对用户的Top-N推荐列表结果L:根据用户偏好矩阵P,获得推荐列表结果L,具体数学化的表示如下:其中,Top-N(pui)表示取用户useru偏好pui的Top-N;E、对算法进行离线评估,优化算法模型:采用均方误差来衡量预测效果的优劣,其数学化表示如下:采用根据RMSE采用单一变量分析法,来调整步骤A到步骤D中涉及的参数,以使算法推荐效果离线最优;F、实现对用户的个性化推荐:当模型调试到离线最优状态时,可进行上线测试,实现对用户的个性化推荐。本专利技术较现有技术相比,具有以下优点及有益效果:(1)本专利技术基于物品的协同过滤技术,主要分两步进行,首先通过用户物品评分矩阵计算物品与物品之间的相似性,然后利用用户历史评分数据和物品物品相似性矩阵计算用户对其它物品的偏好,物品协同过滤技术主要利用了用户之间的集体智慧来计算物品之间的相似性,进而计算用户对物品的偏好。(2)本专利技术首先针对电视端用户历史评分数据较难直接获取,构建了一种打分策略来将用户的观影行为转换为评分数据,然后利用构建的评分数据计算物品与物品相似性,最后实现推荐。附图说明图1为本专利技术的流程示意图。具体实施方式下面结合实施例对本专利技术作进一步地详细说明:实施例一如图1所示,一种基于协同过滤的电视终端节目个性化推荐方法,其方法步骤如下:A、根据用户的历史观影行为构建用户-节目-评分矩阵R;从采集的观影行为中抽取最近T_day天的用户观影行为作为算法源数据,对算法源数据进行如下两步清洗处理:A1、去除过于活跃的用户:从T_day天的用户观影行为中统计所有用户的观影情况,取一定比例相对非活跃的用户参与到后续步骤B,一定比例为整个用户所占比X1;其中,活跃用户的活跃度指在T_day天的用户观影行为中统计出的单个用户观看的节目数;A2、剔除过于热门的节目:从T_day天的用户观影行为中统计所有节目被观看的情况,取一定比例相对非热门的节目参与到后续步骤B;其中,热门节目的热门度指在T_day天的用户观影行为中统计出的单个节目有多少用户观看过;经过步骤A清洗后的数据有m个用户,用户表示为user,n个节目,节目表示为item,则R表示为:式中,rui表示用户useru对节目itemi的评分;其中rui采用如下方式构建:式中,null表示用户useru未观看节目itemi,C为用户useru对节目itemi观看的总次数,T为节目itemi的总时长,tc表示用户useru每次观看节目itemi的时长,α为收缩因子,表示连乘符号;式中,是所有的集合,上式表示对构建后的评分数据进行max-min归一化处理;B、根据用户物品评分矩阵R计算节目-节目-相似性矩阵W,节目-节目-相似性矩阵W表示为:式中,wij表示节目itemi与节目itemj的相似性;取出两个节目各自观看的所有用户对其的评分,并取其中公有的用户对它们的评分来计算两个节目的相似性;具体数学化的表示如下:其中,Uij表示既观看了itemi又观看了itemj的用户,|Uij|表示既观看了itemi又观看了itemj的用户数目,表示所有观看了节目itemi的用户对节目i本文档来自技高网...
一种基于协同过滤的电视终端节目个性化推荐方法

【技术保护点】
一种基于协同过滤的电视终端节目个性化推荐方法,其特征在于:其方法步骤如下:A、根据用户的历史观影行为构建用户‑节目‑评分矩阵R;从采集的观影行为中抽取最近T_day天的用户观影行为作为算法源数据,对算法源数据进行如下两步清洗处理:A1、去除过于活跃的用户:从T_day天的用户观影行为中统计所有用户的观影情况,取一定比例相对非活跃的用户参与到后续步骤B,一定比例为整个用户所占比X1;其中,活跃用户的活跃度指在T_day天的用户观影行为中统计出的单个用户观看的节目数;A2、剔除过于热门的节目:从T_day天的用户观影行为中统计所有节目被观看的情况,取一定比例相对非热门的节目参与到后续步骤B;其中,热门节目的热门度指在T_day天的用户观影行为中统计出的单个节目有多少用户观看过;经过步骤A清洗后的数据有m个用户,用户表示为user,n个节目,节目表示为item,则R表示为:

【技术特征摘要】
1.一种基于协同过滤的电视终端节目个性化推荐方法,其特征在于:其方法步骤如下:A、根据用户的历史观影行为构建用户-节目-评分矩阵R;从采集的观影行为中抽取最近T_day天的用户观影行为作为算法源数据,对算法源数据进行如下两步清洗处理:A1、去除过于活跃的用户:从T_day天的用户观影行为中统计所有用户的观影情况,取一定比例相对非活跃的用户参与到后续步骤B,一定比例为整个用户所占比X1;其中,活跃用户的活跃度指在T_day天的用户观影行为中统计出的单个用户观看的节目数;A2、剔除过于热门的节目:从T_day天的用户观影行为中统计所有节目被观看的情况,取一定比例相对非热门的节目参与到后续步骤B;其中,热门节目的热门度指在T_day天的用户观影行为中统计出的单个节目有多少用户观看过;经过步骤A清洗后的数据有m个用户,用户表示为user,n个节目,节目表示为item,则R表示为:式中,rui表示用户useru对节目itemi的评分;其中rui采用如下方式构建:式中,null表示用户useru未观看节目itemi,C为用户useru对节目itemi观看的总次数,T为节目itemi的总时长,tc...

【专利技术属性】
技术研发人员:肖欣庭孙永强刘鑫唐军
申请(专利权)人:四川长虹电器股份有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1