一种社交网络推荐系统及方法技术方案

技术编号:10497749 阅读:116 留言:0更新日期:2014-10-04 14:59
本发明专利技术公开了一种社交网络推荐系统及方法,涉及数据挖掘技术领域。本发明专利技术公开的系统包括:并行数据获取模块,并行获取必要的社交网络数据,实时获取用户间的交互信息;用户间链接强度计算模块,基于用户间的交互信息并行计算用户间的链接强度;并行化社区发现模块,根据用户间的链接强度,结合相应的聚类算法,实现并行化的社区发现;基于社区发现结果的潜在信息分析与推荐模块,在社区发现的基础上,分析用户潜在的信息,分析特定社区的成因结构特性、关键用户以及分析关键词在社区间的分布特性,对社交网络中的用户,综合其个体信息及所在社区信息进行推荐。本发明专利技术还公开了社交网络推荐方法。本申请技术方案提高了推荐系统的定向性和准确性。

【技术实现步骤摘要】

本专利技术涉及数据挖掘和网络
,尤其涉及。
技术介绍
近年来,社交网络迅速崛起,极大的改变了人们的工作和生活。社交网络可以便捷的共享个人和专业信息,例如兴趣爱好,
等,并且提供多样化的沟通方式,例如关注,评论,转发等。这些行为一方面使得网络数据的激增,这些规模巨大的数据背后隐藏着许多有价值的信息;另一方面在社交网络中构成了社区结构,社区内部的用户之间关系紧密,社区之间的关系则较为稀疏。 同时,推荐系统已经广泛的运用于各种领域,诸如电子商务,社交网络等都不同程度的使用了各种形式的推荐系统。其中,常用的协同过滤技术尤其适合应用在文化产品上,例如推荐音乐,电影等。但是协同过滤技术也同样存在着很多局限性:如冷启动问题,评分矩阵稀疏问题,可扩展性问题等等,这些都成为制约推荐系统实施的重要因素。提高推荐的及时性和准确性一直是推荐系统研究的热点和难点。 许多研究工作已经取得了一定的效果,但仍然没能很好的综合处理社交网络场景下的推荐问题。比如:社交网络中数据集的快速获取问题、合理的链接强度的计算问题、对大数据集的并行化处理问题、数据分析与推荐的及时性和准确性问题、流量和存储空间的有效利用问题等等。
技术实现思路
本专利技术所要解决的技术问题是,提供,保证对大规模数据集推荐的高效性、可靠性和及时性。 为了解决上述技术问题,本专利技术公开了一种社交网络推荐系统,其包括: 并行数据获取模块,并行获取必要的社交网络数据,实时获取用户间的交互信息,并存储所获取的数据集; 用户间链接强度计算模块,基于所述并行数据获取模块所获取的用户间的交互信息进行用户间的链接强度的并行计算; 并行化社区发现模块,根据所述用户间链接强度计算模块计算出的用户间的链接强度,结合相应的聚类算法,对并行数据获取模块所获取的数据集实现并行化的社区发现; 基于社区发现结果的潜在信息分析与推荐模块,在并行化社区发现模块社区发现结果的基础上,分析用户潜在的信息,分析特定社区的成因结构特性、关键用户以及分析关键词在社区间的分布特性,对社交网络中的用户,综合其个体信息及所在社区信息进行推荐。 较佳地,上述系统中,所述必要的社交网络数据包括如下任一种或几种: 用户信息、关注列表、粉丝列表、@信息、话题信息、标签信息、博文消息列表与评论列表。 较佳地,上述系统中,所述用户间链接强度计算模块进行用户间的链接强度的并行计算的过程如下: 对所述并行数据获取模块所获取的整个数据集中的用户ID进行取模运算,得到的模数为集群计算节点数; 根据计算得到的各用户对应的模值,将用户数据分割到对应的计算节点,并行计算用户间的链接强度。 较佳地,上述系统中,所述用户间链接强度计算模块按照如下公式计算用户间的链接强度Wij:本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/55/201310097930.html" title="一种社交网络推荐系统及方法原文来自X技术">社交网络推荐系统及方法</a>

【技术保护点】
一种社交网络推荐系统,其特征在于,该系统包括:并行数据获取模块,并行获取必要的社交网络数据,实时获取用户间的交互信息,并存储所获取的数据集;用户间链接强度计算模块,基于所述并行数据获取模块所获取的用户间的交互信息进行用户间的链接强度的并行计算;并行化社区发现模块,根据所述用户间链接强度计算模块计算出的用户间的链接强度,结合相应的聚类算法,对并行数据获取模块所获取的数据集实现并行化的社区发现;基于社区发现结果的潜在信息分析与推荐模块,在并行化社区发现模块社区发现结果的基础上,分析用户潜在的信息,分析特定社区的成因结构特性、关键用户以及分析关键词在社区间的分布特性,对社交网络中的用户,综合其个体信息及所在社区信息进行推荐。

【技术特征摘要】
1.一种社交网络推荐系统,其特征在于,该系统包括: 并行数据获取模块,并行获取必要的社交网络数据,实时获取用户间的交互信息,并存储所获取的数据集; 用户间链接强度计算模块,基于所述并行数据获取模块所获取的用户间的交互信息进行用户间的链接强度的并行计算; 并行化社区发现模块,根据所述用户间链接强度计算模块计算出的用户间的链接强度,结合相应的聚类算法,对并行数据获取模块所获取的数据集实现并行化的社区发现; 基于社区发现结果的潜在信息分析与推荐模块,在并行化社区发现模块社区发现结果的基础上,分析用户潜在的信息,分析特定社区的成因结构特性、关键用户以及分析关键词在社区间的分布特性,对社交网络中的用户,综合其个体信息及所在社区信息进行推荐。2.如权利要求1所述的系统,其特征在于,所述必要的社交网络数据包括如下任一种或几种: 用户信息、关注列表、粉丝列表、@信息、话题信息、标签信息、博文消息列表与评论列表。3.如权利要求1或2所述的系统,其特征在于,所述用户间链接强度计算模块进行用户间的链接强度的并行计算的过程如下: 对所述并行数据获取模块所获取的整个数据集中的用户ID进行取模运算,得到的模数为集群计算节点数; 根据计算得到的各用户对应的模值,将用户数据分割到对应的计算节点,并行计算用户间的链接强度。4.如权利要求3所述的系统,其特征在于,所述用户间链接强度计算模块按照如下公式计算用户间的链接强度Wij:其中,Wu为用户i与用户j间的链接强度,rji = 1,2,3)分别表示用户i与用户j之间的好友关系,用户i与用户j之间@的次数以及用户i与用户j之间评论的次数,k表示用户i与用户j之间的各种交互信息的权重。5.如权利要求3所述的系统,其特征在于,所述并行化社区发现模块根据所述用户间链接强度计算模块计算出的用户间的链接强度,结合相应的聚类算法,对并行数据获取模块所获取的数据集实现并行化的社区发现指: 将并行计算的用户间的链接强度组成的邻接矩阵分割到各个计算节点上,并行计算其度矩阵和Laplacian矩阵; 对Laplacian矩阵进行特征值和特征向量的并行Lanczos数值求解,得到矩阵前K个最大特征值和对应的特征向量; 将得到的特征向量排成一行,构造出特征向量矩阵U,并对其行归一化,得到规范化特征向量矩阵Y; 再对规范化的特征向量矩阵Y进行特征提取,将每...

【专利技术属性】
技术研发人员:陆平罗圣美胡磊王桥林云龙邹俊洋钟齐炜陆建
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1