当前位置: 首页 > 专利查询>浙江大学专利>正文

一种应用于社区发现的可覆盖聚类算法制造技术

技术编号:8105809 阅读:205 留言:0更新日期:2012-12-21 04:41
本发明专利技术公开了一种应用于社区发现的可覆盖聚类算法,首先在得到原始数据之后,将其转化为“用户——属性图”。在初始化?候选子图之后,对“用户——属性图”中的行为进行初步的分类,其次,计算出每个候选子图的占优属性;同时计算出每个用户和各个候选子图之间的相关性。之后,建立概率统计模型,计算每个“用户——属性”对和候选子图之间的相关性。对候选子图进行迭代构造,运行到可以得到稳定而有效的候选子图结构为止。最后,根据数据环境中的这些候选子图的建立,对于数据中的各个“用户——属性图”对进行合理的分类,发现拥有多种属性的关键用户。本发明专利技术用于同时处理内容性数据和相关性数据,更好的适应真实网络环境中的社区发现需求。

【技术实现步骤摘要】

本专利技术属于网络信息
,特别地涉及一种应用于社区发现基于内容性数据和相关性数据的可覆盖聚类算法。
技术介绍
随着互联网技术的发展,各种新型的网络应用层出不穷,日益丰富了网络用户的虚拟社交行为。进而,互联网和用户之间早已不是像信息发布端和信息接收端这种简单而直接的关系,互联网已构成了向用户提供生产生活的密不可分的另一个世界——“虚拟社会网络”,并且用户也更加积极和主动地融入进这个新的社会平台中。比如,用户会提出自己特定的观点,用户会自发形成讨论组,而网络公司则针对用户群体进行差异化的营销。为了能有效和深入地研究虚拟社会网络这一新型的互联网的表现形式,大量的研究者们对于网络中的“社区发现”这一问题进行了大量的工作。“社区发现”这一名词中的社区指的是网络中具有相同行为特性的用户的集合,从微观上来看集合内的用户之间,相比于集合外存在大量的信息交互、行为合作;而从宏观上来看,集合往往自身具有相似的兴趣倾向,并对社会事件有相似的观点或理解。于是,“社区发现”具体是指通过科学的数学建模和高效的大规模计算方法从社会网络中找出大量的潜在的社区或社区结构,即为用户形成的类。“社区发现”有着广泛本文档来自技高网...

【技术保护点】
一种应用于社区发现的可覆盖聚类算法,其特征在于,包括以下步骤:步骤1,给出所需要的数据输入,具体包括以下子步骤,步骤11,设立数据环境中的用户集合为U={u1,u2,u3,......uN},一共有N个;设立数据环境中的属性集合为A={a1,a2,a3,......aM},一共有M个;用ui→aj代表第i个用户拥有第j个属性;步骤12,用属性矩阵E代表用户和属性之间的关系,即为内容性数据,在数据环境中,定义E∈RN×M,eij∈{0,1},1≤i≤N,1≤j≤M,当eij=1时,表示第i个用户拥有第j个属性,eij=0时,表示第i个用户不拥有第j个属性;步骤13,用邻接矩阵W来代表用户和用户之...

【技术特征摘要】

【专利技术属性】
技术研发人员:何周舟张仲非飞利浦余
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1