本发明专利技术公开了一种个性化内容推荐方法,包括:根据用户的访问数据以生成用户第一兴趣列表;对候选文件进行处理形成候选文件列表;根据含有所述用户第一兴趣列表中的关键词的其他用户的兴趣列表,对所述用户第一兴趣列表进行兴趣扩散以形成用户第二兴趣列表;比较用户第二兴趣列表和候选文件列表之间的相似度,并从大到小排序将TOP-K个候选文件推荐给用户。本发明专利技术采取了上述技术方案以后,不需要用户的评分转换评分参与计算,而是通过用户对内容的偏好度(关键词权重)和关键词在该用户相关的群体中的流行度来计算某项内容推荐给用户的可能性。此外,本发明专利技术还公开了一种个性化内容推荐平台以及系统。
【技术实现步骤摘要】
本专利技术涉及无线互联网
,具体来说,涉及一种个性化内容推荐的方法和系统。
技术介绍
随着移动互联网时代的到来,用户的需求也发展到了一个新的阶段,体现为对贴心服务和个性化服务的追求。同时,随着各种移动互联网业务的极大丰富,“用户寻找信息”的被动服务模式将逐步转变为“信息寻找用户”的主动服务模式。实现这种信息寻找用户的核心技术就是个性化推荐技术(Personalized Recommendation Techniques)。推荐技术就是通过记录和分析用户浏览行为或者购买行为,发现用户的兴趣偏好,然后在海量数据库中找到与之兴趣相近的人群、内容或者商品,筛选和过滤这些信息,然后向该用户推荐他可能会感兴趣的内容或者商品。例如您浏览过一本编程的图书,推荐技术就会关注很多其它同样找编程图书的用户,记录他们的搜索,浏览,点击和购买行为,来确定哪些人与当前用户具有同样的兴趣;然后,为当前用户做出个性化的商品或内容推荐。个性化推荐技术在互联网领域已经产生了巨大的商业价值,Amazon有35%以上的图书收入来自系统提供的推荐;Netflix有60%以上的电影租赁收入来自系统的推荐,Google利用个性化推荐技术为每个用户组织其新闻资讯,提升了 38%的点击通过率;Apple的Genius的个性化音乐服务深受广大用户的喜爱。在个性化推荐领域,网页这类文本内容的推荐又是一个非常重要的领域,尤其是在移动互联网领域,浏览网页(包括新闻资讯、博客等形式,客户端、浏览器等方式)仍然是当前移动互联网数据流量中的最主要的组成部分。手机能浏览到的网页中,WAP网页数量超过20亿,部分终端还能直接访问更丰富的Web网页。同时,移动互联网网网民超过3亿,其中绝大部分有过资讯内容的浏览行为。如何从海量的信息中计算得到海量用户可能感兴趣的内容并推荐给他,是一个极具挑战性的
现有技术主要有两种技术方案比较流行,具体来说,包括(I)基于协同过滤的个性化推荐方法协同过滤算法是以被推荐对象Item为中心的个性化推荐算法,Item可以是网页、图书、音乐、视频、实物等任意对象。根据机器学习理论,它属于基于实例的学习范畴。与传统的以用户为中心的实例学习算法相比,它的主要差异在于为每个Item、而不是用户构建近邻集合,并产生最终的评分预测结果。协同过滤算法有很多种,但原理上基本上一致。因此下面以其中最为典型的SlopeOne算法来进行说明SlopeOne算法提出的主要目的有两点1)解决基于实例的算法可伸缩性问题。在典型的产品评论、电子商务类网站中,以Item为中心构建近邻集合相比于以用户为中心的算法能够显著减少计算量和存储开销;2)提升预测准确性。一些文献的经验评估表明,相比于以用户为中心的算法,此类算法预测准确性较高。需要指出的是,还有一类协同过滤算法,它们通过建立依赖关系来构建预测器,被称为“基于模型的算法”。在基于模型的算法中,一般不显著构建近邻集合,而是通过训练贝叶斯网络、模糊聚类等方式来产生预测结果。它们的离线计算复杂度通常远高于基于实例的算法,但存储开销和在线计算复杂度又远低于后者。在实践中,这两类算法都有大规模应用的案例。其主要流程如图I所示。(2)基于内容的个性化推荐算法基于内容的推荐(content-based recommendation)不需要依据用户对项目的评价意见,而依据用户已经选择的产品内容信息计算用户之间的相似性,送两送行相应的推荐。随着机器学习等技术的完善,当前的基于内容的推荐系统可以分别对用户和内容建立配置文件,通过分析已经购买(或浏览)过的内容,建立或更新用户的配置文件。系统可以比较出用户与内容的相似度,并直接向用户推荐与其配置文件最相似的产品。基于内容的推荐算法的根本在于信息获取和信息过滤。因为在文本信息获取与过滤方法的研究较为成熟,现有很多基于内容的推荐系统都是通过分析产品的文本信息进行推荐。在信息获取中,表征文本最常用的方法就TF-IDF方法,该方法的定义如下设有M个文本文件,关键词h在Hii个文件中出现,设fu为关键词h在文件Cli中出现的次数,那么kj在文件4中的词频TFu定义为权利要求1.一种个性化内容推荐方法,包括 根据用户的访问数据生成用户第一兴趣列表; 对候选文件进行处理形成候选文件列表;其特征在于,还包括 根据含有所述用户第一兴趣列表中的关键词的其他用户的兴趣列表,对所述用户第一兴趣列表进行兴趣扩散形成用户第二兴趣列表; 比较用户第二兴趣列表和候选文件列表之间的相似度,并从大到小排序将TOP-K个候选文件推荐给用户。2.根据权利要求I所述的个性化内容推荐方法,其特征在于,所述根据含有所述用户第一兴趣列表中的关键词的其他用户的兴趣列表,对所述用户第一兴趣列表进行兴趣扩散形成用户第二兴趣列表,具体包括 分别计算用户第一兴趣列表中关键词向其他所有用户推荐关键词的推荐能力; 根据所述关键词的推荐能力形成兴趣扩散矩阵; 根据所述兴趣扩散矩阵对用户第一兴趣列表进行向量计算,形成用户第二兴趣列表。3.根据权利要求I或2所述的个性化内容推荐方法,其特征在于,所述根据用户的访问数据生成用户第一兴趣列表,具体包括 建立用户集合Ui = K,U2,.. .,un},其中,用户Ui的兴趣列表采用向量空间模型表示 Pi = ((T1, Wil), (T2, wi2), . . . , (Tk, Wik)), 其中,Wij表示用户Ui第一兴趣列表中关键词L对于用户Ui的权重,k表示用户Ui第一兴趣列表之中所有关键词的数量。4.根据权利要求I或2所述的个性化内容推荐方法,其特征在于,所述对候选文件进行处理形成候选文件列表,具体包括 建立候选文件集合D = {屯,d2,. . .,dn},其中,候选文件4的文件列表采用向量空间模型表示为 dj = KT1, Wlj), (T2, w2J), . . . , (Tk, wkJ)}, 其中,Wij表示文件七之中关键词Ti在文件4之中的权值,k表示文件4之中关键词的数量。5.根据权利要求2所述的个性化内容推荐方法,其特征在于,所述分别计算列表中任意关键词向所有用户推荐其他关键词的推荐能力,具体包括 设定有N个用户,按照下列表达式计算任一关键词i相对于关键词j对所有用户的推荐能力6.根据权利要求5所述的个性化内容推荐方法,其特征在于,所述根据上述推荐能力形成兴趣扩散矩阵,根据所述兴趣扩散矩阵对用户第一兴趣列表进行向量计算,形成用户第二兴趣列表,具体包括 根据所述推荐能力Vu形成兴趣扩散矩阵V = {ViJ.}; 按照下列表达式进行扩散形成所述用户第二兴趣列表7.根据权利要求6所述的个性化内容推荐方法,其特征在于,所述比较用户第二兴趣列表和候选文件列表之间的相似度,并从大到小排序将TOP-K个候选文件推荐给用户,具体包括 基于夹角余弦法计算所述第二兴趣列表Pi'和候选文件列表4的相似性,具体包括 接着,根据值从大到小排序将Top-κ个文件推荐给用户。8.—种个性化内容推荐平台,其特征在于,包括 用户兴趣计算模块,用于根据用户的访问数据生成用户第一兴趣列表; 候选文件预处理模块,用于对候选文件进行处理形成候选文件列表; 用户兴趣扩散本文档来自技高网...
【技术保护点】
一种个性化内容推荐方法,包括:根据用户的访问数据生成用户第一兴趣列表;对候选文件进行处理形成候选文件列表;其特征在于,还包括:根据含有所述用户第一兴趣列表中的关键词的其他用户的兴趣列表,对所述用户第一兴趣列表进行兴趣扩散形成用户第二兴趣列表;比较用户第二兴趣列表和候选文件列表之间的相似度,并从大到小排序将TOP?K个候选文件推荐给用户。
【技术特征摘要】
【专利技术属性】
技术研发人员:陶振武,
申请(专利权)人:中国移动通信集团公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。