当前位置: 首页 > 专利查询>燕山大学专利>正文

一种基于LDA的加权平均的个性化好友推荐方法技术

技术编号:17408547 阅读:44 留言:0更新日期:2018-03-07 05:52
本发明专利技术公开了一种基于LDA的加权平均的个性化好友推荐方法,其内容包括:获取社交网络中目标用户t的一度、二度、…m度好友形成候选好友集合C,提取目标用户和集合C中每个用户的静态属性信息;利用LDA主题建模的方法,分析候选用户关注的主题,从而推断候选用户的兴趣爱好,身份地位和年龄性别信息;分析社交网络中用户的动态行为信息,用加权平均法计算用户间相似性;最终得到目标用户对候选用户的评分向量,根据评分向量进行排序,把排名前Top‑N的候选用户推荐给目标用户。本发明专利技术更全面的考虑目标用户和候选用户的属性信息,很大程度上提高好友推荐的精度。本发明专利技术在微博数据集上进行验证,实验结果表明本发明专利技术具有良好的推荐效果。

A personalized friend recommendation method based on weighted average of LDA

The invention discloses a weighted average based personalized friend recommendation method based on LDA. Its contents include: obtaining the target user t in social network by one time, two degrees, and... M friends friends candidate set C formation, extraction of the target users and the static attribute information for each user set C; using the method of LDA modeling and analysis of candidate user concerns, thus infer the candidate user interests, status and age gender information; dynamic behavior of information users of social networks, users the similarity is calculated by weighted average method; finally get the target users to the candidate user score vector, sorted according to the score vector, the candidate user ranked Top N recommendation to target users. The invention has more comprehensive consideration of the attribute information of the target users and the candidate users, to a great extent, to improve the accuracy of the friends' recommendation. The invention is verified on the micro-blog data set, and the experimental results show that the invention has good recommendation effect.

【技术实现步骤摘要】
一种基于LDA的加权平均的个性化好友推荐方法
本专利技术属于互联网
,涉及互联网下的社交网络推荐,尤其涉及一种基于LDA的加权平均的个性化好友推荐方法。
技术介绍
随着Web2.0技术的蓬勃发展,全球逐渐迎来了社交网络(SocialNetwork)时代,一些具有代表性的社交网站已成为影响力巨大的信息平台,如:Facebook,Twitter和新浪微博等。它们将用户群体和信息结合在一起,使用户可以便捷地分享和获取信息,同时也极大地拓展了用户的社交群体。但是,随着社交网络用户迅速增多,社交网络中信息量急剧增大,对社交网络用户来说,如何在这些庞大的数据中找到合适自己的好友,扩展自己的社交网络好友圈成为一个难题。为了解决社交网络信息量大和好友寻找困难问题,推荐和搜索成为人们关注的焦点。用户利用好友搜索功能来查找好友以扩大交际圈,但是,这种搜索浪费大量的时间,效率低,并且不具有准确性。而各大社交网络平台相继推出各种推荐策略来满足用户需求,但是,目前的推荐算法具有诸多局限性。经典的协同过滤方法,不能很好的解决数据稀疏性问题,考虑的用户信息也较少,推荐效果不理想。基于标签的推荐方法,重点考虑了用户的静态属性而忽视了更具社交价值的动态交互行为,从而不能很好的获取社交网络用户的特性,推荐效果也不理想。已有的好友推荐方法考虑问题单一化,没有进行用户特征的全面分析,具有不同程度的局限性,因此,本专利技术提出了一种综合地考虑社交网络用户的多方面特征,推断用户人物画像,从而进行准确地个性化好友推荐方法。该方法通过将用户在社交网络中的结构特征(用户的动态行为)和用户节点特征(用户的静态属性)进行加权平均从而计算社交网络用户间的相似度;通过用户间的相似度进行排序,挑选前Top-N个候选用户;然后,把Top_N个用户推荐给目标用户。在本专利技术中使用了查准率和查全率以及F1-Measure等评估指标对好友推荐进行评估。最后,通过在真实的微博数据集上进行的实验,进一步验证了本方法能更准确的进行个性化好友推荐。
技术实现思路
针对已有推荐方法中没有综合考虑社交网络中用户的动态行为特征和静态属性信息的局限,本专利技术克服了现有技术中的不足,提供一种基于LDA的加权平均的个性化好友推荐方法。本专利技术将个性化的好友推荐问题抽象为提取用户的动态行为特征和静态属性信息的问题,利用加权平均的方法对上述两方面进行综合建模,获取用户间相似度信息,然后,根据用户间的相似度,挑选出前Top-N个最适合目标用户的好友,并把这些用户推荐给目标用户。具体地,本专利技术是通过以下技术方案实现的:一种基于LDA的加权平均的个性化好友推荐方法,该方法把用户的节点信息特征和社交网络结构特征利用加权平均的方法有效结合,建立统一模型的个性化好友推荐方法;所述用户的节点信息特征是指用户的静态属性;所述社交网络结构特征是指用户的动态行为;其具体内容包括如下步骤:步骤一:首先,获取社交网络中目标用户t的一度、二度、…m度好友形成候选好友集合C,提取目标用户和集合C中每个用户的静态属性信息,即每个用户都具有一个静态属性结构,这些静态属性信息包括目标用户和候选用户间的共同好友数,自身地理位置,以及在社交网中与自身相关的帖子;步骤二:对于步骤一所述候选用户相关帖子,利用LDA主题建模的方法,分析候选用户关注的主题,从而推断候选用户的兴趣爱好,身份地位和年龄性别信息;然后根据社交网络目标用户的静态属性,包括目标用户与候选用户的共同好友数,目标用户和候选用户的地理位置,以及目标用户和候选用户关注的“主题”,分别对候选集合中的候选用户和目标用户进行了相似度计算,其计算依据如下:①目标用户与候选用户的共同好友数越多,目标用户与候选用户的相似度就越高;②线上行为可能影响线下行为,目标用户与候选用户间的地理位置越近,目标用户与候选用户间就越容易成为好友;③目标用户和候选用户共同的话题数越多,目标用户与候选用户的兴趣就越相似,成为好友的可能性也就越大;在本专利技术方法中,利用加权平均的方法为上述的各个静态属性分别赋予一个权重,同时为了平衡上述静态属性在计算社交网络中目标用户和候选用户间相似度的重要程度,使用sigmod的函数对各个特征进行缩放;步骤三:考虑到社交网络中用户间的交互性行为以及社交网络的动态性,分析社交网络中用户的动态行为信息,并综合考虑用户间动态行为的关联,将其建模到好友推荐方法中;其中用户交互性行为包括:转发行为、回复行为、评论行为、点赞行为和@行为,根据这些动态行为,对这些用户间的交互性行为进行相似度计算;所述转发行为又包括:①目标用户转发候选用户的帖子;②目标用户和候选用户在一段时间内转发同一篇帖子;相似的,回复,点赞,评论和@在本专利技术中也都被定义为两种形式;所述回复行为,其限定条件包括:①目标用户回复候选用户的帖子;②目标用户和候选用户回复同一篇其他用户的帖子;所述点赞行为,其限定条件包括:①目标用户给候选用户的帖子点赞,或者候选用户给目标用户的帖子点赞;②目标用户和候选用户同一段时间内为其他用户的同一篇帖子点赞;所述评论行为,其限定条件包括:①目标用户评论了候选用户的帖子,或者候选用户评论了目标用户的帖子;②目标用户和候选用户在一段时间内共同评论了相同的一篇帖子;所述@行为,其限定条件包括:①目标用户@候选用户,或者候选用户@目标用户;②目标用户和候选用户在一段时间内共同@第三个其他用户。通常,用户间直接发生的行为比用户间接通过第三个人发生的行为更能体现用户间的交互程度,所以直接关联比间接关联更重要。步骤四:用加权平均法计算用户间的相似性;为社交网络候选用户的动态行为分配权重,并把步骤二所述的目标用户的静态属性信息分配权重,将两方面结合进行统一建模,综合计算目标用户与候选用户间的相似度,最终得到目标用户对候选用户的相似度向量,也就是目标用户对候选用户的评分向量;步骤五:对步骤四中所得到的目标用户对候选用户评分向量进行排序,把排名在前Top-N的候选用户推荐给目标用户。最后通过实验验证本专利技术提出的好友推荐方法在准确度上有明显提升,推荐效果更好。由于采用上述技术方案,本专利技术提供的一种基于LDA的加权平均的个性化好友推荐方法,与现有技术相比具有这样的有益效果:本专利技术设计了一个基于加权平均的个性化好友推荐方法,利用加权平均的方法有效的结合了社交网络中目标用户和候选用户的静态属性信息和动态行为特征,从而进行个性化的好友推荐。在静态属性建模时,用LDA主题模型分析目标用户和候选用户的话题,获取用户隐式的兴趣和爱好等,据此推断目标用户和候选用户的身份地位,行业,性别和年龄等,形成比较符合实际的目标用户和候选用户人物画像。相比于传统的好友推荐方法,本专利技术更全面的考虑了目标用户和候选用户的属性信息包括动态行为和静态属性,很大程度上提高好友推荐的精度。本专利技术在微博数据集上进行了验证,实验结果表明本专利技术具有良好的推荐效果。附图说明图1是本专利技术方法框架示意图;图2是LDA的图模型;图3是用户行为静态统计图;图4是F1-Measure实验结果图。具体实施方式下面结合附图和具体实施方式,对本专利技术做进一步说明。本专利技术的一种基于LDA的加权平均的个性化好友推荐方法,其框架示意图如图1所示。其具体内容包括如下步骤:步骤本文档来自技高网
...
一种基于LDA的加权平均的个性化好友推荐方法

【技术保护点】
一种基于LDA的加权平均的个性化好友推荐方法,其特征在于:该方法把用户的节点信息特征和社交网络结构特征利用加权平均的方法有效结合,建立统一模型的个性化好友推荐方法;所述用户的节点信息特征是指用户的静态属性;所述社交网络结构特征是指用户的动态行为;所述方法具体内容包括如下步骤:步骤一:首先,获取社交网络中目标用户t的一度、二度、…m度好友形成候选好友集合C,提取目标用户和集合C中每个用户的静态属性信息,即每个用户都具有一个静态属性结构,这些静态属性信息包括目标用户和候选用户间的共同好友数,自身地理位置,以及在社交网中与自身相关的帖子;步骤二:对于步骤一所述候选用户相关帖子,利用LDA主题建模的方法,分析候选用户关注的主题,从而推断候选用户的兴趣爱好,身份地位和年龄性别信息;然后根据社交网络目标用户的静态属性,包括目标用户与候选用户的共同好友数,目标用户和候选用户的地理位置,以及目标用户和候选用户关注的“主题”,分别对候选集合中的候选用户和目标用户进行相似度计算,其计算依据如下:①目标用户与候选用户的共同好友数越多,目标用户与候选用户的相似度就越高;②线上行为可能影响线下行为,目标用户与候选用户间的地理位置越近,目标用户与候选用户间就越容易成为好友;③目标用户和候选用户共同的话题数越多,目标用户与候选用户的兴趣就越相似,成为好友的可能性也就越大;利用加权平均的方法为上述的各个静态属性分别赋予一个权重,同时为了平衡上述静态属性在计算社交网络中目标用户和候选用户间相似度的重要程度,使用sigmod的函数对各个特征进行缩放;步骤三:考虑到社交网络中用户间的交互性行为以及社交网络的动态性,分析社交网络中用户的动态行为信息,并综合考虑用户间动态行为的关联,将其建模到好友推荐方法中;其中用户交互性行为包括:转发行为、回复行为、评论行为、点赞行为和@行为,根据这些动态行为,对这些用户间的交互性行为进行相似度计算;步骤四:用加权平均法计算用户间相似性;为社交网络候选用户的动态行为分配权重,并把步骤二所述的目标用户的静态属性信息分配权重,将两方面结合进行统一建模,综合计算目标用户与候选用户间的相似度,最终得到目标用户对候选用户的相似度向量,也就是目标用户对候选用户的评分向量;步骤五:对步骤四中所得到的目标用户对候选用户评分向量进行排序,把排名在前Top‑N的候选用户推荐给目标用户。...

【技术特征摘要】
1.一种基于LDA的加权平均的个性化好友推荐方法,其特征在于:该方法把用户的节点信息特征和社交网络结构特征利用加权平均的方法有效结合,建立统一模型的个性化好友推荐方法;所述用户的节点信息特征是指用户的静态属性;所述社交网络结构特征是指用户的动态行为;所述方法具体内容包括如下步骤:步骤一:首先,获取社交网络中目标用户t的一度、二度、…m度好友形成候选好友集合C,提取目标用户和集合C中每个用户的静态属性信息,即每个用户都具有一个静态属性结构,这些静态属性信息包括目标用户和候选用户间的共同好友数,自身地理位置,以及在社交网中与自身相关的帖子;步骤二:对于步骤一所述候选用户相关帖子,利用LDA主题建模的方法,分析候选用户关注的主题,从而推断候选用户的兴趣爱好,身份地位和年龄性别信息;然后根据社交网络目标用户的静态属性,包括目标用户与候选用户的共同好友数,目标用户和候选用户的地理位置,以及目标用户和候选用户关注的“主题”,分别对候选集合中的候选用户和目标用户进行相似度计算,其计算依据如下:①目标用户与候选用户的共同好友数越多,目标用户与候选用户的相似度就越高;②线上行为可能影响线下行为,目标用户与候选用户间的地理位置越近,目标用户与候选用户间就越容易成为好友;③目标用户和候选用户共同的话题数越多,目标用户与候选用户的兴趣就越相似,成为好友的可能性也就越大;利用加权平均的方法为上述的各个静态属性分别赋予一个权重,同时为了平衡上述静态属性在计算社交网络中目标用户和候选用户间相似度的重要程度,使用sigmod的函数对各个特征进行缩放;步骤三:考虑到社交网络中用户间的交互性行为以及社交...

【专利技术属性】
技术研发人员:宫继兵宋艳青高小霞宋雅稀刘吉辉
申请(专利权)人:燕山大学
类型:发明
国别省市:河北,13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1