基于多元信用评估的用户偏好预测方法技术

技术编号:21299210 阅读:32 留言:0更新日期:2019-06-12 07:50
本发明专利技术提供一种基于多元信用评估的用户偏好预测方法,属于互联网用户偏好预测技术领域。该方法首先构建目标用户与其他用户间的信任邻接矩阵以及目标用户与商品间的评分稀疏矩阵;根据信任邻接矩阵和评分稀疏矩阵,获取目标用户的综合信任度和重要度,并对其分别进行归一化处理;根据所述归一化处理后的综合信任度和重要度,建立目标用户对商品的评分预测模型,构造评分预测模型的目标函数,通过梯度下降法优化目标函数,获取用户偏好向量和商品特征向量;根据用户偏好向量和商品特征向量,计算目标用户偏好。本发明专利技术考虑了用户间的直接信任关系以及通过中介用户传递的间接信任关系,剔除了恶意用户对偏好预测的影响,计算复杂度小,预测更加准确。

Prediction Method of User Preferences Based on Multivariate Credit Assessment

The invention provides a user preference prediction method based on multiple credit evaluation, which belongs to the technical field of Internet user preference prediction. Firstly, the trust adjacency matrix between the target user and other users and the score sparse matrix between the target user and the commodity are constructed. According to the trust adjacency matrix and the score sparse matrix, the comprehensive trust and importance of the target user are obtained and normalized, respectively. According to the comprehensive trust and importance of the normalized process, the target user pair is established. The objective function of the scoring prediction model is constructed. The gradient descent method is used to optimize the objective function, and the user preference vector and the product feature vector are obtained. According to the user preference vector and the product feature vector, the target user preference is calculated. The invention considers the direct trust relationship between users and the indirect trust relationship transmitted by intermediary users, eliminates the influence of malicious users on preference prediction, has low computational complexity and more accurate prediction.

【技术实现步骤摘要】
基于多元信用评估的用户偏好预测方法
本专利技术涉及互联网用户偏好预测
,具体涉及一种预测更加准确的基于多元信用评估的用户偏好预测方法。
技术介绍
Web2.0的出现和普及给互联网用户带来了大量的信息,满足了用户在信息时代对信息的需求,但随着互联网规模的迅速扩大而带来的网上可用信息的大幅增加,使得互联网用户在面对大量信息时无法从中获取自己感兴趣的信息以及对自己有用的信息,降低了对信息的使用效率,这就是所谓的信息超载问题。解决信息超载问题一个非常有潜力的办法是推荐系统,它是根据用户的信息需求、兴趣等,将用户感兴趣的信息、产品等推荐给用户的个性化信息推荐系统。和搜索引擎相比推荐系统通过研究用户的兴趣偏好,进行个性化计算,由系统发现用户的兴趣点,从而引导用户发现自己的信息需求。一个好的推荐系统不仅能为用户提供个性化的服务,还能和用户之间建立密切关系,让用户对推荐产生依赖。在推荐系统中,一个核心的问题就是对用户的偏好建模。所谓的用户偏好就是指用户对物品(可能是音乐,电影,商品等)的喜好程度。如何根据已有的用户行为和信息,准确地对用户偏好进行预测是一个很重要的问题。传统推荐算法利用用户对物品的历史评分信息来预测用户的偏好,其中经典的推荐算法为协同过滤。协同过滤又包括基于物品的协同过滤与基于用户的协同过滤。基于物品的协同过滤算法的推荐思想是,如果用户喜欢物品A,那么该用户很可能也喜欢与A相似的物品B。基于用户的协同过滤算法的推荐思想是,如果用户A喜欢某一物品,那么与用户A相似的用户B也可能喜欢该物品。基于用户的协同过滤通过用户与物品关联矩阵计算用户间相似度,从而将相似用户感兴趣的物品有限推荐给目标用户。近来结合用户的历史评分信息和用户之间的社交网络来预测用户的兴趣偏好成为推荐领域的一个研究热点。Epinions利用用户之间的直接信任关系来学习用户的偏好,从而为目标用户推荐其潜在感兴趣的物品。其基本思想是:相比于协同过滤算法计算得出的邻居,目标用户的兴趣偏好更接近于其直接信任的用户。通过利用用户的信任网络计算得出目标用户邻居以及评分权重并应用于协同过滤中的方法,推荐系统的准确性较传统协同过滤算法有较大的提升。通过在矩阵分解技术的基础上结合用户的信任网络,推荐系统可以更加准确地学习到用户的偏好向量和物品的特征向量,从而提供更加准确的个性化推荐结果。虽然通过用户间的直接信任信息来预测用户的兴趣偏好取得了较传统算法更好的预测效果,但依然存在以下几个方面的问题:第一,由于不同用户之间的信任值是不同的,因此利用直接信任用户之间的信任信息进行用户偏好预测的过程中需要对两两用户之间的信任值进行计算,譬如用户A同时信任用户B和用户C,但由于用户B的评分/评论和用户C的评分/评论对用户A的帮助不同,所以用户A对用户B和用户C的信任程度是不同的,所以需要分别计算用户A与用户B的信任度以及用户A与用户C的信任度,造成计算量大,且计算不准确。第二,同用户评分信息类似,用户之间的信任信息也具有稀疏性,具体表现为用户信列表中的信任用户数量所占网站用户量的比例极小。信任信息的稀疏性导致用户之间信任值计算的不准确以及不能很好地计算用户的影响力,从而导致用户偏好预测的不准确。第三,现有推荐系统没有将用户之间的不信任关系考虑进去,导致不能发现恶意用户的恶意评分/评论,从而影响信任值的计算准确性,损害推荐系统的性能表现。
技术实现思路
本专利技术的目的在于提供一种考虑了用户间的多元信用关系的用户偏好预测方法,以解决上述
技术介绍
中存在的技术问题。为了实现上述目的,本专利技术采取了如下技术方案:本专利技术提供的一种基于多元信用评估的用户偏好预测方法,该方法包括如下流程步骤:步骤S110:构建目标用户与其他用户间的信任邻接矩阵以及目标用户与商品间的评分稀疏矩阵;步骤S120:根据所述信任邻接矩阵和所述评分稀疏矩阵,获取所述目标用户的综合信任度,并对其进行归一化处理;步骤S130:根据所述信任邻接矩阵和所述评分稀疏矩阵,获取目标用户的重要度,并对其进行归一化处理;步骤S140:根据所述归一化处理后的综合信任度和重要度,建立目标用户对商品的评分预测模型;步骤S150:构造所述评分预测模型的目标函数,通过梯度下降法优化所述目标函数,获取用户偏好向量和商品特征向量;步骤S160:根据所述用户偏好向量和所述商品特征向量,利用所述评分预测模型计算目标用户偏好。进一步的,所述步骤S110中,构建信任邻接矩阵具体包括:根据每个用户的信任列表获得网络信任关系拓扑G={U,E},构建目标用户与其他用户之间的有向信任邻接矩阵M,其中,U表示用户集合,E表示用户间的信任关系集合,进一步的,所述步骤S120具体包括,步骤S121:根据所述评分稀疏矩阵,获取用户u和用户v之间的相似度;其中,sim(u,v)表示用户u和用户v之间的相似度,表示用户u对商品的平均评分,表示用户v对商品的平均评分,I(u)表示用户u评价过的商品集合,I(v)表示用户v评价过的商品集合,Ru,i表示用户u对商品i的评分,Rv,i表示用户v对商品i的评分;步骤S122:结合所述相似度,计算所述目标用户的直接信任度;其中,DTu,v表示目标用户u和用户v之间的直接信任度,表示与用户v有直接信任关系的用户的个数,表示用户v的信任列表中的用户总个数,|Iv|表示用户v评价过的商品的个数,|I|表示商品的总个数;步骤S123:计算所述目标用户的间接信任度,具体包括:用户u与用户v之间除具有直接信任关系外,还存在通过其他具有与用户u存在直接信任关系的用户w传递的间接信任关系,则用户u与用户v之间的间接信任度为:其中,DTw,v表示用户v与用户w之间的直接信任度,DTu,w表示用户u与用户w之间的直接信任度,表示与用户u有直接信任关系的用户集合;步骤S124:利用线性函数对所述直接信任度和所述间接信任度进行加权融合,得综合信任度,为:T′u,v=mDTu,v+(1-m)ITu,v;其中,m表示一个0到1之间的常数,用来控制直接信任度和间接信任度所占的比重,m的值越大,直接信任度的比重越大,m的值越小,则间接信任度所占的比重越大;步骤S125:对所述综合信任度进行归一化处理,使T′u,v的值保持在0到1之间,其中,表示的是用户u的信任用户的集合,它包括用户u的直接信任用户和间接信任用户。进一步的,所述步骤S130具体包括:根据所述评分稀疏矩阵中目标用户评价过的商品数量以及所述信任邻接矩阵中目标用户受到其他用户信任的数量,得到目标用户的重要度为:其中,|Iu|表示目标用户u所评价过的商品的个数,|I|表示商品的总个数,表示用户u的活跃度,表示用户u的信任关系的数量,|T|表示信任关系的总个数,表示用户u的权威度,s是一个0到1之间的常数,s的值越大,用户的活跃度在重要度中所占比重越大,s越小,用户权威度在重要度中所占比重越大,∈ut表示网络中评分数与用户u一样的用户的比例,δut表示网络中关注者数量和用户u一样的用户的比例;对重要度Wu′进行归一化处理,得:进一步的,所述步骤S140中,建立的目标用户对商品的评分预测模型为:其中,表示用户u对商品i的偏好预测值,qi表示商品i的特征向量,pu表示用户u的特征向量,b是一个0到1之本文档来自技高网
...

【技术保护点】
1.一种基于多元信用评估的用户偏好预测方法,其特征在于,包括如下流程步骤:步骤S110:构建目标用户与其他用户间的信任邻接矩阵以及目标用户与商品间的评分稀疏矩阵;步骤S120:根据所述信任邻接矩阵和所述评分稀疏矩阵,获取所述目标用户的综合信任度,并对其进行归一化处理;步骤S130:根据所述信任邻接矩阵和所述评分稀疏矩阵,获取目标用户的重要度,并对其进行归一化处理;步骤S140:根据所述归一化处理后的综合信任度和重要度,建立目标用户对商品的评分预测模型;步骤S150:构造所述评分预测模型的目标函数,通过梯度下降法优化所述目标函数,获取用户偏好向量和商品特征向量;步骤S160:根据所述用户偏好向量和所述商品特征向量,利用所述评分预测模型计算目标用户偏好。

【技术特征摘要】
1.一种基于多元信用评估的用户偏好预测方法,其特征在于,包括如下流程步骤:步骤S110:构建目标用户与其他用户间的信任邻接矩阵以及目标用户与商品间的评分稀疏矩阵;步骤S120:根据所述信任邻接矩阵和所述评分稀疏矩阵,获取所述目标用户的综合信任度,并对其进行归一化处理;步骤S130:根据所述信任邻接矩阵和所述评分稀疏矩阵,获取目标用户的重要度,并对其进行归一化处理;步骤S140:根据所述归一化处理后的综合信任度和重要度,建立目标用户对商品的评分预测模型;步骤S150:构造所述评分预测模型的目标函数,通过梯度下降法优化所述目标函数,获取用户偏好向量和商品特征向量;步骤S160:根据所述用户偏好向量和所述商品特征向量,利用所述评分预测模型计算目标用户偏好。2.根据权利要求1所述的方法,其特征在于,所述步骤S110中,构建信任邻接矩阵具体包括:根据每个用户的信任列表获得网络信任关系拓扑G={U,E},构建目标用户与其他用户之间的有向信任邻接矩阵M,其中,U表示用户集合,E表示用户间的信任关系集合,3.根据权利要求2所述的方法,其特征在于,所述步骤S120具体包括,步骤S121:根据所述评分稀疏矩阵,获取用户u和用户v之间的相似度;其中,sim(u,v)表示用户u和用户v之间的相似度,表示用户u对商品的平均评分,表示用户v对商品的平均评分,I(u)表示用户u评价过的商品集合,I(v)表示用户v评价过的商品集合,Ru,i表示用户u对商品i的评分,Rv,i表示用户v对商品i的评分;步骤S122:结合所述相似度,计算所述目标用户的直接信任度;其中,DTu,v表示目标用户u和用户v之间的直接信任度,表示与用户v有直接信任关系的用户的个数,表示用户v的信任列表中的用户总个数,|Iv|表示用户v评价过的商品的个数,|I|表示商品的总个数;步骤S123:计算所述目标用户的间接信任度,具体包括:用户u与用户v之间除具有直接信任关系外,还存在通过其他具有与用户u存在直接信任关系的用户w传递的间接信任关系,则用户u与用户v之间的间接信任度为:其中,DTw,v表示用户v与用户w之间的直接信任度,DTu,w表示用户u...

【专利技术属性】
技术研发人员:熊菲李朝一沈伟瀚李泽松杨平
申请(专利权)人:北京交通大学中电科大数据研究院有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1