一种数据处理方法、装置、及计算机可读存储介质制造方法及图纸

技术编号:18527165 阅读:87 留言:0更新日期:2018-07-25 13:15
本发明专利技术提供了一种数据处理方法,包括以下步骤:将网络划分成多个社区;分别计算每个社区中内部节点间的相似度;确定每个社区的中心节点,将隶属不同社区的节点间的相似度表示为节点对应的社区的中心节点间的相似度。基于上述数据处理方法,本发明专利技术还提供了一种数据处理装置、及计算机可读存储介质。本发明专利技术的技术方案将网络划分成多个社区,降低了数据处理的规模,位于不同社区的节点间的相似度用各自社区的中心节点间的相似度进行近似,精度不受太大的影响,算法的效率大大提升。

【技术实现步骤摘要】
一种数据处理方法、装置、及计算机可读存储介质
本专利技术涉及通讯
,特别涉及一种数据处理方法、装置、及计算机可读存储介质。
技术介绍
目前,网络中两用户之间的相似度计算方法有多种,典型的方法包括基于节点局部信息的方法和基于网络拓扑结构信息的方法。基于节点局部信息的方法考虑节点的邻居信息。一般来说,如果网络中的两个节点有着相同或者相近的邻居节点,那么这两个节点被认为是相似的,基于该思想的相似度构造方法大致有以下三种:假设Γi表示节点i的邻居集合,|Γi|表示该集合的势,|Γi∩Γj|表示节点i和节点j共有的邻居个数。可以定义如下三种相似度:基于信号传递思想将网络拓扑结构信息转化为空间向量信息,它的基本思想是将网络中的节点当作具有接收和发射信号的节点,首先从网络中任选一个节点v,给v赋一个信号值,然后v向自己和自己的邻居节点发射该信号值,接到信号的节点记录并保存相应的信号值,同理,其它的节点也进行同样的接收和发送信号的过程,如此传递下去,经过T次传递之后,位于同一个社区里的节点对网络中其它节点传递的信号量是接近的。信号传递的过程可以用数学公式表示,即V=(I+A)T,I表示单位矩阵本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,包括:将网络划分成多个社区;分别计算每个社区中内部节点间的相似度;确定每个社区的中心节点,将隶属不同社区的节点间的相似度表示为所述节点对应的社区的中心节点间的相似度。

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:将网络划分成多个社区;分别计算每个社区中内部节点间的相似度;确定每个社区的中心节点,将隶属不同社区的节点间的相似度表示为所述节点对应的社区的中心节点间的相似度。2.如权利要求1所述的数据处理方法,其特征在于,所述将网络划分成多个社区包括:采用预设的模块度优化算法将所述网络划分成多个社区。3.如权利要求1所述的数据处理方法,其特征在于,所述确定每个社区的中心节点包括:对每个社区中的多个内部节点采用预设的算法按照重要性进行排序,得到每个社区的中心节点。4.如权利要求3所述的数据处理方法,其特征在于,所述预设的算法包括page-rank算法。5.如权利要求1所述的数据处理方法,其特征在于,在将隶属不同社区的节点间的相似度表示为所述节点对应的社区的中心节点间的相似度之前,还包括:确定中心节点间的相似度。6.一种数据处理装置,其特征在于,包括社区划分模块、第一处理模块、第二处理模块;所述社区划分模块...

【专利技术属性】
技术研发人员:姜雅文徐海张博李博文袁苏文孙昊超木日力格江逸楠
申请(专利权)人:中国电子科技集团公司电子科学研究院
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1