一种融合信任度的社交网络好友推荐方法技术

技术编号:18732427 阅读:40 留言:0更新日期:2018-08-22 03:02
本发明专利技术提出一种融合信任度的社交网络好友推荐方法,涉及到用户相似度、置信因子计算和融合。根据社交网络拓扑的推荐偏重于已认识的好友而忽略潜在感兴趣的好友,根据兴趣推荐偏重于推荐陌生用户,难以得到用户信任,同时这两种推荐都没有考虑用户在社交网络中的行为,极大的影响了推荐结果的准确性、可靠性和全面性。本发明专利技术提出一种综合考虑社交网络拓扑、用户兴趣和社交行为的推荐方法。首先,根据用户社交网络中共同邻居计算出社交相似度,根据关键字计算兴趣相似度,并进行线性组合。综合考虑用户社交拓扑和社交行为,计算出关系置信度和行为置信度,融合成置信因子。最后,将相似度和置信因子融合,提高相似度计算可信度,产生Top‑N推荐列表。

A trust recommendation method for social network friends

The present invention proposes a social network friend recommendation method that integrates trust degree, which involves user similarity, confidence factor calculation and fusion. According to the recommendation of social network topology, the recommendation emphasizes on the known friends but neglects the potential interested friends. According to the recommendation of interest, the recommendation emphasizes on the recommendation of strangers, which makes it difficult for users to trust. At the same time, neither Recommendation considers the behavior of users in social network, which greatly affects the accuracy and reliability of recommendation results. And comprehensiveness. The invention proposes a comprehensive recommendation method considering social network topology, user interest and social behavior. Firstly, the social similarity is calculated according to the common neighbors in the social network, and the interest similarity is calculated according to the keywords, and the linear combination is carried out. Considering the user's social topology and social behavior, the relationship confidence and behavior confidence are calculated and fused into confidence factors. Finally, the similarity and confidence factors are fused to improve the reliability of similarity calculation and generate Top N recommendation list.

【技术实现步骤摘要】
一种融合信任度的社交网络好友推荐方法
本专利技术涉及数据挖掘和推荐系统领域,特别是涉及一种融合信任度的社交网络好友推荐方法。
技术介绍
随着Web2.0的发展,社交网络成为Web2.0模式发展中出现的一个典型应用,个性化推荐技术也在社交网络中得到了广泛的应用。社交网络也即是社会网络服务(SocialNetworkService,SNS),直观的讲可以说是基于网络的社交,其发展大致可分为:E-mail,BBS,BLOG,Facebook/人人网等个阶段。在社交网络中,用户通过添加好友,关注机制等方式进行互动交流以及信息分享,而相互之间添加好友必然使用户之间产生一种联系,随着时间的发展,用户与其好友以及好友的好友之间共同形成了一种好友社交网络,从中我们可以了解到用户的兴趣爱好,信息分享、交流情况以及其活跃程度等等。另外,由于社交网络中的用户基数比较大,而且网络中的用户大多是相互之间缺乏了解和信任的陌生人,因此不可能随意形成好友关系,这些都是在社交网络中进行好友推荐时必须要考虑的问题。作为推荐系统的核心组成部分,推荐算法的研究不断受到学者们的关注,各种推荐算法层出不穷,然而推荐算法都有一定的局限性,且推荐的大多是具有“物性”的对象,而有关社交网络用户或好友的推荐方面的研究则相对较少。即便在现有的好友推荐算法中,主要是基于社交网络拓扑结果和用户兴趣。通过社交网络拓扑推荐偏重于推荐线下认识的好友,主要通过共同好友得到相似性指标,而通过兴趣推荐偏重于推荐具有相同兴趣的陌生用户,往往推荐结果难以得到用户的信任。同时这两种推荐都没有考虑到用户在社交网络中的行为,极大的影响了推荐的结果的准确性、可靠性和全面性。
技术实现思路
为了克服上述现有技术中存在的缺陷,本专利技术的目的是提供一种融合信任度的社交网络好友推荐方法。该方法综合考虑社交网络拓扑、用户兴趣和社交行为。首先,根据用户社交网络中共同邻居计算出用户的社交相似度,根据TF-IDF算法和余弦相似度计算兴趣相似度,并进行线性组合。综合考虑用户社交拓扑和社交行为,分别计算出关系度和行为置信度,线性组合成置信因子。最后,将相似度和置信因子进行融合,提高相似度计算可信度,产生Top-N推荐列表。为了实现本专利技术的上述目的,本专利技术提供了一种融合信任度的社交网络好友推荐方法,包括如下步骤:S1:计算用户社交相似度。用户a的粉丝(follower)组成一个集合,关注者(followee)组成一个不同集合。选用关注者(followee)计算方法,用户a和用户b的社交相似度定义如下:其中,follower(a)、follower(b)分别表示用户a和用户b的关注用户集合,follower(a)∩follower(b)表示用户a和用户b共同关注者的集合,|follower(a)∩follower(b)|表示用户a和用户b共同关注者集合的元素个数。同理可得,|follower(a)|和|follower(b)|分别表示用户a和用户b的关注用户集合的元素个数;S2:提取用户在社交网络中发布、转发的所有文本,对文本进行分词,计算词频:其中,M表示文本的总词数,m表示当前字词在文本中出现的次数;S3:计算IDF逆文本值。为了减少“停止词”对文本分类结果的不利影响,需要计算每个字词对于当前文本的主题的贡献度。某个词与文本主题越相关其权值越高,反之亦然。IDF逆文本频率指数提供了该权值的计算方式,其公式为:D表示所有文本的总数,Dw表示词w在D中总共出现的次数,当Dw越大,w的权值越小;S4:计算用户的关键词权重向量。将S3和S4的计算结果作为输入,利用公式TFIDF=TF*IDF得到用户的特征向量vectora={(p1,w1),(p2,w2),(p3,w3)…},其中pi表示属性,wi表示pi的权重。S5:计算用户的兴趣相似度。将S4的输出作为S5输入,在得到用户关键词向量之后,利用余弦相似度计算用户之间的相似度:其中pai,pbi分别表示用户a和用户b的特征向量的第i个数值;S6:计算关系置信度,利用用户共同关注好友的数量占用户关注好友总数的比例度量关系置信度。公式如下:其中,follower(a)、follower(b)分别表示用户a和用户b的关注用户集合,follower(a)∩follower(b)表示用户a和用户b共同关注者的集合,follower(a)∪follower(b)表示用户a和用户b关注着的并集;S7:计算行为置信度,使用用户a和用户b之间互动行为数占用户a和用户b互动总数的比例表示行为置信度。计算方法如下:其中,action(a,b)表示用户a对用户b的互动行为数量,action(b,a)表示用户b对a的互动行为数量。action(a)和action(b)分别表示用户a对用户b的互动行为总量;S8:对上S6和S7的结果进行融合,得到置信因子:Trusab=tηrealtiab+θnTrust,其中η+θ=1,η=0.1,θ=0.9;S9:融合相似度。对社交相似度和兴趣相似度进行线性结合。相似度计算公式如下:Simab=λsocailSimab+βinterestSimab,其中λ+β=1,λ=0.7,β=0.3。S10:在S9基础上,为了增强相似度的可信度,利用可信因子对相似度进行修正,同时提高推荐满意度和新颖度。公式如下:resultab=Simab+Trustab,其中Simab表示用户a和用户b的相似度,Trustab表示a和b的置信因子。根据resultab产生Top-N推荐列表。本文提出了一种融合信任度的社交网络好友推荐方法,将好友的推荐分为两个步骤:用户相似度计算和用户执行因子计算。从而解决了根据社交网络拓扑推荐偏重于已经认识的好友而忽略潜在的感兴趣好友推荐,根据兴趣推荐偏重于推荐陌生用户,难以得到用户的信任,同时这两种推荐都没有考虑到用户在社交网络中的行为,极大的影响了推荐的结果的准确性、可靠性和全面性的问题。用户相似度计算包括社交相似度、兴趣相似度和这两个相似度的融合。首先利用用户共同好友计算社交网络相似度,借鉴TF-IDF算法思想计算用户关键词的权值,并根据余弦相似度得到兴趣相似度,对这两个相似度进行线性融合,找到最佳融合参数,本专利技术中λ=0.7,β=0.3。其次,通过关系置信度和行为置信度融合得到用户的置信因子,用于修正相似度计算结果。本专利技术中,关系置信度和行为置信度的融合参数为η=0.1,θ=0.9,最后将融合相似度和置信因子相加得到结果,进行Top-N推荐。附图说明本专利技术的上述和/或附加的方面和优点,结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1是本专利技术的整体流程结构示意图;图2是本专利技术的用户兴趣相似度计算过程图;图3是本专利技术的用户相似度计算流程示意图;图4是本专利技术的置信因子计算流程示意图;具体实施方式下面结合附图对本专利技术的具体实施作进一步的详细阐明。图1是本专利技术的整体流程结构示意图。本专利技术主要包含三个部分:用户相似度计算、置信因子计算和相似度和置信因子融合,通过最终修正后的用户相似度,得到排名并产生用户推荐列表。首先,根据用户社交网络中共同邻居计算出用户的社交相似度,根据TF-IDF算法得到用户关键字及其向量,利用余弦相似度计算本文档来自技高网
...

【技术保护点】
1.一种融合信任度的社交网络好友推荐方法,其特征在于,所述方法包括:用户社交相似度计算、用户兴趣相似度计算以及相似度融合,关系置信度计算、行为置信度计算以及置信因子融合,最后通过相似度和置信因子的融合,产生Top‑N推荐列表。在进行用户推荐时,综合考虑社交网络拓扑、用户兴趣计算出社交相似度和兴趣相似度,将两种相似度进行融合得到用户相似度,综合考虑用户社交拓扑和社交行为,分别计算出关系度和行为置信度,线性组合成置信因子,对相似度计算结果进行修正,将相似度和置信因子进行融合,提高相似度计算可信度,产生Top‑N推荐列表。具体内容包括:将用户社交网络转化为图结构,一个用户用一个节点表示,根据用户社交网络拓扑中,拥有共同好友的数量计算用户的社交相似度;根据用户在社交网络中转发、发布的文本提取关键字计算兴趣相似度;融合社交相似度和兴趣相似度,通过不断地实验找到最佳的融合参数,以此表示用户的相似度;利用用户共同关注好友的数量占用户关注好友总数的比例度量关系置信度;利用用户之间的互动情况计算用户的行为置信度;通过实验找到最佳的置信因子融合参数,将两种置信度融合成为置信因子;最后利用置信因子修正相似度就算结果,产生Top‑N推荐结果。...

【技术特征摘要】
1.一种融合信任度的社交网络好友推荐方法,其特征在于,所述方法包括:用户社交相似度计算、用户兴趣相似度计算以及相似度融合,关系置信度计算、行为置信度计算以及置信因子融合,最后通过相似度和置信因子的融合,产生Top-N推荐列表。在进行用户推荐时,综合考虑社交网络拓扑、用户兴趣计算出社交相似度和兴趣相似度,将两种相似度进行融合得到用户相似度,综合考虑用户社交拓扑和社交行为,分别计算出关系度和行为置信度,线性组合成置信因子,对相似度计算结果进行修正,将相似度和置信因子进行融合,提高相似度计算可信度,产生Top-N推荐列表。具体内容包括:将用户社交网络转化为图结构,一个用户用一个节点表示,根据用户社交网络拓扑中,拥有共同好友的数量计算用户的社交相似度;根据用户在社交网络中转发、发布的文本提取关键字计算兴趣相似度;融合社交相似度和兴趣相似度,通过不断地实验找到最佳的融合参数,以此表示用户的相似度;利用用户共同关注好友的数量占用户关注好友总数的比例度量关系置信度;利用用户之间的互动情况计算用户的行为置信度;通过实验找到最佳的置信因子融合参数,将两种置信度融合成为置信因子;最后利用置信因子修正相似度就算结果,产生Top-N推荐结果。2.根据权利要求1所述的方法,其特征在于,将每个用户视作一个节点,若用户之间有联系,则在对应节点之间添加一条边,从而得到整个用户网络的无向图。搜索用户的共同关注的好友,计算出任意两个用户之间的社交相似度。3.根据权利要求1所述的方法,其特征在于,从用户在社交网络中产生的相关内容提取关键字,这些关键字可以精确地描述用户特点、偏好等。利用关键词的相似程度,表示用户的兴趣相似度。4.根据权利要求1所述的方法,其特征在于,基于两个用户...

【专利技术属性】
技术研发人员:徐光侠代皓马创刘俊何李杰唐志京
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1