一种推荐方法以及系统技术方案

技术编号:10458069 阅读:62 留言:0更新日期:2014-09-24 14:19
本发明专利技术涉及一种推荐方法以及系统。所述推荐方法包括以下步骤:数据获取步骤,获取关于用户的行为数据以及物品的特征数据;相似度计算步骤,利用所获取的所述行为数据和特征数据获取物品和物品之间的相似度矩阵;推荐矩阵计算步骤,利用所述用户的行为数据生成用户对物品的概率矩阵,并将所述概率矩阵与所述相似度矩阵相乘来获取推荐矩阵。

【技术实现步骤摘要】
一种推荐方法以及系统
本专利技术涉及信息处理领域,特别涉及信息处理领域中的相似性度量的方法以及系 统。
技术介绍
当前,在众多领域均涉及相似性度量,并基于各种已有的相似性度量方法进行相 似性分析进而进行推荐。例如在互联网行业等领域所涉及的推荐的方法。 现有的进行推荐的方法包括以下几种。一种基于系统过滤技术产生推荐。包括利 用现有相似性度量方法。如:皮尔逊相关系数、Jaccard系数、余弦相似度、相关相似度等相 似性度量方法,得到Τ0Ρ_Ν的近邻。利用Τ0Ρ_Ν的近邻,根据其操作情况,推荐相关结果。一 种是基于矩阵分解技术产生推荐。包括svd分解、修正的svd分解技术等。矩阵分解技术 认为用户的评分为用户属性向量和物品属性向量的内积。还有多种推荐技术的叠加。主要 基于多种推荐结果的叠加,在扩大推荐关联效果、消除单个推荐算法存在的问题上,有一定 优势。但显然,这是一种屈就的解决办法。同时不可克服的较高的运算复杂度。 但是以往的推荐方法存在针各种各样的问题,例如user_based CF和item_based CF是相同的算法;user_based CF和item_based CF,推荐效果较差的问题;现有相似度计 算方法,主要基于属性向量的相似度计算方法,其效果较差的问题;矩阵分解算法在适应隐 反馈信息时候,效果较差的问题;运算复杂度不可控的问题;矩阵稀疏和冷启动等问题的 最佳解决办法;基于用户行为的信息和基于内容、标签、社会关系等的信息,其不能有效融 合和最大限度利用的问题。
技术实现思路
本专利技术就是鉴于上述问题而完成的,其目的在提供以下一种推荐方法和系统:通 过概率和统计的方法,深入的研究了个性化推荐技术的本质,提出了新的个性化推荐技术, 指出了传统个性化推荐技术的错误,系统解决了传统个性化推荐技术的以上至少一个问 题。 本专利技术涉及一种推荐方法,包括以下步骤:数据获取步骤,获取关于用户的行为数 据以及物品的特征数据;相似度计算步骤,利用所获取的所述行为数据和特征数据获取物 品和物品之间的相似度矩阵;推荐矩阵计算步骤,利用所述用户的行为数据生成用户对物 品的概率矩阵,并将所述概率矩阵与所述相似度矩阵相乘来获取推荐矩阵。 根据本专利技术所涉及的推荐方法,其中,所述相似度计算步骤包括以下步骤:基于行 为数据的相似度计算步骤,计算基于行为数据的物品和物品之间的相似度;基于特征数据 的相似度计算步骤,计算基于特征数据的物品和物品之间的相似度;以及相似度综合步骤, 将基于行为数据所得到的相似度与基于特征数据所得到的相似度利用以下的贝叶斯公式 进行综合,来得到贝叶斯相似度矩阵, 其中,bp bj表示物品,下标变量i和j为正整数,先验概率密度sim' bj)为 基于特征数据的物品h和物品h之间的相似度结果,条件概率密度sim bj为基于 行为数据的物品h和物品h相似度结果,sim ' bp表示进行了相似度综合的物品 4和物品h之间的贝叶斯相似度。 根据本专利技术所涉及的推荐方法,其中,在所述基于行为数据的相似度计算步骤中, 利用所获取用户集合中的用户a和物品集合中的物品b、以及用户集合中的用户a对物品 集合中的物品b无差别的相似性操作次数sim(a,b),执行基于下式的物品集合内部物品bj 与物品h的相似性值sim bj的计算,以生成相似度矩阵, 本文档来自技高网...
一种推荐方法以及系统

【技术保护点】
一种推荐方法,其特征在于,包括以下步骤: 数据获取步骤,获取关于用户的行为数据以及物品的特征数据; 相似度计算步骤,利用所获取的所述行为数据和特征数据获取物品和物品之间的相似度矩阵; 推荐矩阵计算步骤,利用所述用户的行为数据生成用户对物品的概率矩阵,并将所述概率矩阵与所述相似度矩阵相乘来获取推荐矩阵。

【技术特征摘要】
1. 一种推荐方法,其特征在于,包括以下步骤: 数据获取步骤,获取关于用户的行为数据以及物品的特征数据; 相似度计算步骤,利用所获取的所述行为数据和特征数据获取物品和物品之间的相似 度矩阵; 推荐矩阵计算步骤,利用所述用户的行为数据生成用户对物品的概率矩阵,并将所述 概率矩阵与所述相似度矩阵相乘来获取推荐矩阵。2. 根据权利要求1所述的推荐方法,其特征在于, 所述相似度计算步骤包括以下步骤: 基于行为数据的相似度计算步骤,计算基于行为数据的物品和物品之间的相似度; 基于特征数据的相似度计算步骤,计算基于特征数据的物品和物品之间的相似度;以 及 相似度综合步骤,将基于行为数据所得到的相似度与基于特征数据所得到的相似度利 用以下的贝叶斯公式进行综合,来得到贝叶斯相似度矩阵,其中,bp bj表示物品,下标变量i和j为正整数,先验概率密度sim' bp为基于 特征数据的物品4和物品bj之间的相似度结果,条件概率密度sim (bj,bj为基于行为数 据的物品bj和物品h相似度结果,sim ' bj)表示进行了相似度综合的物品h和物 品h之间的贝叶斯相似度。3. 根据权利要求1所述的推荐方法,其特征在于, 在所述基于行为数据的相似度计算步骤中,利用所获取用户集合中的用户a和物品集 合中的物品b、以及用户集合中的用户a对物品集合中的物品b无差别的相似性操作次数 8址(&,1 3),执行基于下式的物品集合内部物品1^与物品1^的相似性值以111〇^,1^)的计算, 以生成相似度矩阵,其中,i,j,m,η表示集合中元素的标号,k是归一化因子。4. 根据权利要求3所述的推荐方法,其特征在于, 将所述相似度矩阵作为输入矩阵,利用计算所述相似度矩阵的方法再次进行计算,以 得到增强相似度关联的物品和物品之间的增强相似度矩阵来作为所述行为数据的物品4 和物品h相似度结果。5. 根据权利要求1所述的推荐方法,其特征在于, 在计算基于行为数据的相似度之前还包括白噪声补偿步骤:将用户对物品操作的次数 低于预定次数的用户补充至预定次数。6. 根据权利要求1至5中任一项所述的推荐方法,其特征在于, 在所述基于特征数据的相似度计算步骤中,利用所获取物品集合中的物品a和属性 集合中的已知属性C、以及属性集合中的已知属性C与物品集合中的物品b的对应属性值 sim(c,b),执行基于下式的物品集合内部物品bi与物品bj的相似性值sim' bp的计 算,以生成针对已知属性的物品和物品之间的相似度矩阵,7. 根据权利要求6所述的推荐方法,其特征在于, 还包括基于特征数据的相似度的白噪声补偿步骤:针对未知属性将任一物品与其他物 品之间的相似度设为相同且和为1,得到针对未知属性的物品和物品之间相似度的白噪声 补偿矩阵,并将所述针对已知属性的物品和物品之间的相似度矩阵与针对未知属性的物品 和物品之间相似度的白噪声补偿矩阵按照预定比例求和,来作为补充了白噪声的基于特征 数据的相似度矩阵。8. 根据权利要求7所述的推荐方法,其特征在于, 还包括最小误差评测步骤,利用训练数据对所述推荐矩阵根据标准最小错误率均方误 差准则进行评测,修改所述白噪声补偿步骤中的所述预定比例来使误差小于一定值。9. 根据权利要求7所述的推荐方法,其特征在于, 还包括以下步骤: 获取用户基于所述推荐矩阵而进行的用户对物品的操作的行为数据; 对该行为数据进行白噪声补偿,将用户对物品操作的次数低于预定次数的用户补充至 预定次数; 将所述贝叶斯相似度矩阵作为先验相似度,将基于进行了白噪声补偿的行为数据而 得到的物品和物品之间的相似度矩阵作为条件相似度,再次利用贝叶斯公式进行相似度计 算,从而得到修正的相似度矩阵。10. -种推荐系统,其特征在于,包括: 数据获取单元,其获取关于用户的行为...

【专利技术属性】
技术研发人员:朱宝
申请(专利权)人:百度移信网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1