一种异构网络可交互可视化方法技术

技术编号:10509465 阅读:168 留言:0更新日期:2014-10-08 12:15
本发明专利技术公开了一种异构网络可交互可视化方法。本方法为:1)对异构网络中的节点按照节点属性的取值进行聚类,并生成相应的聚类网络可视化图;2)对所选聚类结果中的每一节点,计算该节点的邻居节点集合;然后按照邻居节点集合节点属性值对所选聚类结果中的每一节点进行聚类;并生成聚类可视化图作为下一级可视图;3)选取步骤2)的若干聚类结果,对所选聚类结果中的每一节点根据其邻居节点集合进行聚类,将具有相同邻居节点集合的节点划分到同一聚类中;然后将此次聚类结果生成聚类可视化图并将其作为步骤2)所生成聚类网络可视化图的下一级可视图。本发明专利技术结合了拓扑和属性信息,使用户能够用更细的粒度进行更低层级的查看。

【技术实现步骤摘要】
-种异构网络可交互可视化方法
[〇〇〇1] 本专利技术涉及聚类分析、异构网络、数据挖掘、拓扑结构分析、大型数据网络可视化 分析等领域,提出了一种基于异构网络节点属性及网络拓扑结构相结合的处理大型异构网 络数据的方法。该方法适用于社会化网络、计算机网络、传感器网络及知识网络等典型信息 网络数据。是一种可以进行交互分析的可视化展示方法。
技术介绍
大数据时代的到来,在短时间内产生了复杂多变的大型数据网络,很多人开始针 对这些量大、质杂的网络数据进行分析和深入研究。这些数据网络中,一些是在网络节点上 具有不同属性特征的网络类型,一些是拓扑结构和关联关系复杂的网络类型。本专利技术所指 的异构网络数据主要指同时具有以上两种特征的网络,即由一些具有不同属性、类型的数 据节点所构成的较为复杂的关系/关联网络。当前,已有一些研究是针对异构网络数据进 行聚类分析。主要是根据网络数据上节点所具有的不同属性,进行聚类可视化分析。同时, 网络拓扑结构主要指数据节点和数据节点之间因为某种关联关系而相互联系形成的网络, 基于网络拓扑结构的聚类分析也较为常见,如图聚类、谱聚类方法。 在可视化研究领域,大部分的网络数据可视化研究均集中于网络拓扑结构的可视 化。随着web2. 0时代的到来,数据量不断的增加,网络数据的形式已经发生了很大的改变。 现有的一些数据网络很多的结点及他们的边都拥有了属性,对于这种具有属性的异构网络 可视化,现在仍很少有研究。并且,已知的方法均不能结合网络节点属性及拓扑结构进行联 合分析,不能同时基于此两类信息实现可视化展示与分析。例如,Wattenberg对异构网络 的可视化分析进行了研究。但是,他仅仅利用了网络节点属性实现可视化,并没有针对以上 两种异构网络信息进行二者相结合的可视化研究。 具体说来,针对这一类的大型异构网络数据可视化的研究问题如下: 1)现有的异构网络数据可视化聚类分析研究,有一些是基于网络节点属性数据的 聚类分析,一些是基于网络拓扑结构数据的聚类分析,聚类分析方法仅采用网络拓扑结构 或节点属性的单一来源,不能实现结合两类数据类型同时进行聚类分析。.例如,在包含论 文、作者、会议/期刊三类节点的学术异构网络中,已有可视化分析方法不能直观展示哪 些作者的合作者发表了更多的高/中/低引用论文,哪些作者发表的论文有近似的引用率 分布等探索式问题。 现有的大型异构网络数据可视化聚类分析研究,可根据网络节点属性或拓扑结 构,生成一定数目的网络节点聚类。然而,这两种方法的聚类结果颗粒度或过于粗糙以至于 丢失大量网络细节(如基于节点属性的方法将整个网络压缩为几个节点聚类,对应节点属 性的几个取值),或过于细密因此难以布局和展示(如基于网络结构的聚类)。虽然已有一 些方法可以聚类数目为输入(如图分割方法),然而用户难以控制并理解聚类结果,且不能 支持用户自定义的自顶向下可视化浏览分析过程。
技术实现思路
针对上述大型异构网络数据的分析问题,本专利技术的目的在于提出一种异构网络可 交互可视化方法。本专利技术提供了可以解决上述问题的可视数据分析方法以及其可视化实现 形式--洋葱图。这是一种可以根据任意节点本身的属性、拓扑关系,或是两类信息的混合 来进行聚类分析及可视化展示的大型异构网络数据分析方法。各网络结点或节点聚类都可 以灵活的根据属性或拓扑关系进行二次拆分或聚类。在可视化展现上,网络节点根据所在 的聚类层级的不同,用多个同心圆来显示,形象如同一个被切开的洋葱。因此,我们的方法 以洋葱图命名。 本专利技术基于国家 973 科技项目(Supportedby the National Basic Research Program of China under Grant No. 2014CB340301)和国家自然科学基金(the National Science Foundation of China (NSFC)under Grant No. 61379088)的支持,通过分析网络 数据的属性特征及拓扑关系,将大型异构网络数据压缩成分层次的网络节点聚类,提供直 观的可视化形式(洋葱图)展示所计算的网络节点聚类及聚类之间的关系,并通过简单、易 用的交互形式来指引用户分层浏览并可视化分析大型异构网络数据的聚类结果。特别地, 本方法支持用户按照自己的分析需求,选择特定的异构网络局部数据,并从将所选择的某 个层次的网络节点聚类,继续按照分析需求逐层放大(向较低层次聚类)或合并(向较低 层次聚类)。通过在同一异构网络可视化视图种展示不同层次的聚类粒度,实现用户关注的 局部异构网络数据的详细关联分析。 在具体实现中,本方法通过界面的按钮及常见的鼠标操作实现上述交互,支持用 户按需浏览分析大型异构网络数据:用户既可看到较高层次聚类状态下清晰可见的按照节 点属性不同取值聚类的少数几个节点集合,也可通过交互将可视化视图展开为成千上万的 较低聚类层次状态下的异构网络数据聚类分布及关联关系。[〇〇1〇] 为了实现上述目的,本专利技术所采用的技术方案是:[〇〇11] ,其步骤为:[〇〇12] 1)对待处理异构网络中的节点按照选取或设定的节点属性的取值进行聚类,并生 成相应的聚类网络可视化图; 2)选取步骤1)的若干聚类结果,并对所选聚类结果中的每一节点,根据该异构网 络的拓扑结构计算该节点的邻居节点集合;然后按照选取或设定的邻居节点集合节点属性 值对所选聚类结果中的每一节点进行聚类;得到的聚类结果中,位于同一聚类中的节点具 有节点属性值相同且在异构网络中的拓扑位置相似;然后将此次聚类结果生成聚类可视化 图并将其作为步骤1)聚类网络可视化图的下一级可视图; 3)选取步骤2)的若干聚类结果,并对所选聚类结果中的每一节点,根据其邻居节 点集合进行聚类,将具有相同邻居节点集合的节点划分到同一聚类中;得到的聚类结果中, 位于同一聚类中的节点具有节点属性值相同且在异构网络中的拓扑位置相同;然后将此 次聚类结果生成聚类可视化图并将其作为步骤2)所生成聚类网络可视化图的下一级可视 图。 进一步的,所述异构网络为有向异构网络G = (V,E);其中,V = {vp . . .,vj表示 网络节点集合,E = {θι,. . .,ej表示网络边集合;异构网络的邻接矩阵为W,其中的元素 Wij 代表连接节点Vi到节点ν」的边;对于每个节点VpN+Gi) = {ν」|wij = 1}代表节点Vi的出 向邻居节点集合,『(Vi) = {Vj I Wji = 1}为节点Vi的入向邻居节点集合。 进一步的,所述步骤2)或步骤3)中的聚类方法为: 31)将节点Vi的邻居节点集合表示为一个邻居向量R(Vi)= {c n,· · ·,cit,cn,· · ·,cti};其中,cit为节点Vi的第t个出向邻居节点,cti为节点Vi的第t 个入向邻居节点; 32)对于所有需要划分的网络节点,按照其邻居节点集合的向量计算两两节点之 间的节点近似度距离; 33)根据计算出的节点间相似度距离及期望聚类数目,将节点划分为k个聚类。 进一步的,将每一节点采用一统一行向量表示;所述统一行向量包括:节点属性 信息及取值、节点的邻居信息及邻居属性取值;每次聚类时计算节点的统本文档来自技高网
...

【技术保护点】
一种异构网络可交互可视化方法,其步骤为:1)对待处理异构网络中的节点按照选取或设定的节点属性的取值进行聚类,并生成相应的聚类网络可视化图;2)选取步骤1)的若干聚类结果,并对所选聚类结果中的每一节点,根据该异构网络的拓扑结构计算该节点的邻居节点集合;然后按照选取或设定的邻居节点集合节点属性值对所选聚类结果中的每一节点进行聚类;得到的聚类结果中,位于同一聚类中的节点具有节点属性值相同且在异构网络中的拓扑位置相似;然后将此次聚类结果生成聚类可视化图并将其作为步骤1)聚类网络可视化图的下一级可视图;3)选取步骤2)的若干聚类结果,并对所选聚类结果中的每一节点,根据其邻居节点集合进行聚类,将具有相同邻居节点集合的节点划分到同一聚类中;得到的聚类结果中,位于同一聚类中的节点具有节点属性值相同且在异构网络中的拓扑位置相同;然后将此次聚类结果生成聚类可视化图并将其作为步骤2)所生成聚类网络可视化图的下一级可视图。

【技术特征摘要】
2014.03.10 CN 201410085487.81. 一种异构网络可交互可视化方法,其步骤为: 1) 对待处理异构网络中的节点按照选取或设定的节点属性的取值进行聚类,并生成相 应的聚类网络可视化图; 2) 选取步骤1)的若干聚类结果,并对所选聚类结果中的每一节点,根据该异构网络的 拓扑结构计算该节点的邻居节点集合;然后按照选取或设定的邻居节点集合节点属性值对 所选聚类结果中的每一节点进行聚类;得到的聚类结果中,位于同一聚类中的节点具有节 点属性值相同且在异构网络中的拓扑位置相似;然后将此次聚类结果生成聚类可视化图并 将其作为步骤1)聚类网络可视化图的下一级可视图; 3) 选取步骤2)的若干聚类结果,并对所选聚类结果中的每一节点,根据其邻居节点集 合进行聚类,将具有相同邻居节点集合的节点划分到同一聚类中;得到的聚类结果中,位于 同一聚类中的节点具有节点属性值相同且在异构网络中的拓扑位置相同;然后将此次聚类 结果生成聚类可视化图并将其作为步骤2)所生成聚类网络可视化图的下一级可视图。2. 如权利要求1所述的方法,其特征在于所述异构网络为有向异构网络G= (V,E); 其中,V = {ν^ . . .,vn}表示网络节点集合,E = {e。. . .,em}表示网络边集合;异构网络的 邻接矩阵为W,其中的元素 Wij代表连接节点Vi到节点ν」的边;对于每个节点Vp N+(vD = {Vjlwu = 1}代表节点Vi的出向邻居节点集合,Ν? = {Vjlwji = 1}为节点Vi的入向邻 居节点集合。3. 如权利要求1或2所述的方法,其特征在于所述步骤2)...

【专利技术属性】
技术研发人员:时磊赵月林闯
申请(专利权)人:中国科学院软件研究所清华大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1