基于会议期刊星系图的超大规模学术网络可视化方法及系统技术方案

技术编号:24574629 阅读:41 留言:0更新日期:2020-06-21 00:12
本发明专利技术提供了一种基于会议期刊星系图的超大规模学术网络可视化方法及系统,包括:步骤M1:从数据库中获取论文相关数据,并将数据存储在文件中;步骤M2:根据论文的相关数据,对论文按照会议或期刊聚类,并生成包含相应聚类的节点和连边参数的图文件;步骤M3:使用自动化布局工具对相应聚类的节点和连边参数的图文件快速布局,得到聚类内部布局,并生成包含节点位置信息的图文件;步骤M4:根据聚类之间的引用关系,等效聚类之间力的大小,并使用力引导算法生成聚类间星系结构;步骤M5:根据聚类间星系结构对聚类进行融合,得到可视化结果。本发明专利技术以图的方式展示大量论文之间的引用关系,使得原本抽象的论文引用关系变得清晰可见。

Visualization method and system of large scale academic network based on galaxy map of Conference Journal

【技术实现步骤摘要】
基于会议期刊星系图的超大规模学术网络可视化方法及系统
本专利技术涉及数据网络
,具体地,涉及一种基于会议期刊星系图的超大规模学术网络可视化方法及系统,更为具体地,涉及一种基于学术会议或期刊星系图的超大规模学术网络可视化方法及系统。
技术介绍
随着科学技术的飞速发展,学术论文的数量在飞速增长,这一现象直接导致学术网络的体量飞速增长。如何对某一全领域学术网络进行可视化成为当前急需解决的问题。但目前已有的网络布局算法如ForceAtlas,FruchtermanReingold,YifanHu等均无法处理大规模学术网络数据。当学术网络节点数量到达10万左右时,以上算法布局效率急剧下降,使得算法几乎不能正常输出布局结果。而基于深度学习的LargeVis算法可处理大规模学术网络数据,但无法完成对网络细节的精准刻画,只能展示出网络的宏观特征,将图缩放至微观层次后,图出现严重的重叠,使得用户几乎无法从图中获取任何信息量。超大规模网络可视化算法不仅需要解决数据体量剧增后能否布局的问题,更需要解决布局完成后对局部特征刻画是否清晰细腻的问题。而以上算本文档来自技高网...

【技术保护点】
1.一种基于会议期刊星系图的超大规模学术网络可视化方法,其特征在于,包括:/n步骤M1:从数据库中获取论文相关数据,并将数据存储在文件中;/n步骤M2:根据论文的相关数据,对论文按照会议或期刊聚类,并生成包含相应聚类的节点和连边参数的图文件;/n步骤M3:使用自动化布局工具对相应聚类的节点和连边参数的图文件快速布局,得到聚类内部布局,并生成包含节点位置信息的图文件;/n步骤M4:根据聚类之间的引用关系,等效聚类之间力的大小,并使用力引导算法生成聚类间星系结构;/n步骤M5:根据聚类间星系结构对聚类进行融合,得到可视化结果。/n

【技术特征摘要】
1.一种基于会议期刊星系图的超大规模学术网络可视化方法,其特征在于,包括:
步骤M1:从数据库中获取论文相关数据,并将数据存储在文件中;
步骤M2:根据论文的相关数据,对论文按照会议或期刊聚类,并生成包含相应聚类的节点和连边参数的图文件;
步骤M3:使用自动化布局工具对相应聚类的节点和连边参数的图文件快速布局,得到聚类内部布局,并生成包含节点位置信息的图文件;
步骤M4:根据聚类之间的引用关系,等效聚类之间力的大小,并使用力引导算法生成聚类间星系结构;
步骤M5:根据聚类间星系结构对聚类进行融合,得到可视化结果。


2.根据权利要求1所述的基于会议期刊星系图的超大规模学术网络可视化方法,其特征在于,所述步骤M1包括:
步骤M1.1:从数据库获取论文相关数据,包括论文ID数据、论文源数据,并将数据存储在文件中;
步骤M1.2:根据已获取的论文相关数据,从数据库中获取论文的引用关系数据,并存储在文件中。


3.根据权利要求1所述的基于会议期刊星系图的超大规模学术网络可视化方法,其特征在于,所述步骤M2包括:
步骤M2.1:根据存储在文件中的论文的相关数据,按照所发表的会议或期刊进行聚类;
步骤M2.2:提取每个聚类内部论文之间的引用关系;
步骤M2.3:使用圆表示节点,贝塞尔曲线表示连边,并根据引用关系计算节点与连边的相关参数;
节点最大尺寸的计算公式如下:



其中,N表示单个聚类内部的节点数;
每个节点尺寸的计算公式:



其中,InDegree表示聚类入度;InDegreemax表示聚类中最大入度;
连边RGB值的计算公式:



其中,Re,Ge,Be表示连边的RGB值;R1,G1,B1表示节点1的RGB值;R2,G2,B2表示节点2的RGB值;
步骤M2.4:将数据聚类与处理得到的相应聚类的节点和连边信息存储在图文件中。


4.根据权利要求1所述的基于会议期刊星系图的超大规模学术网络可视化方法,其特征在于,所述步骤M3包括:
步骤M3.1:设置自动化布局工具的配置文件以确定自动化布局工具的具体工作流程;
步骤M3.2:使用自动化布局工具对按照所发表的会议或期刊进行聚类结果进行快速布局,并按照预设格式的图文件进行存储。


5.根据权利要求1所述的基于会议期刊星系图的超大规模学术网络可视化方法,其特征在于,所述步骤M4包括:
步骤M4.1:根据聚类之间的论文引用关系,等效不同聚类在力引导模型下的引力大小;
步骤M4.2:根据聚类内部论文引用关系,等效不同聚类在力引导模型下的斥力大小;
步骤M4.3:根据聚类内部布局结果,计算聚类等效节点的大小,并将聚类等效节点的大小写入包含聚类等效节点大小的图文件中,公式如下:



其中,r表示每个节点大坐标原点的距离;(x,y)表示每个节点都含有的位置坐标;



其中,re表示聚类等效节点的大小;rmax表示遍历包含聚类等效节点大小的图文件中的每个节点,得到当前聚类中距离坐标原点最远的节点对应的距离;β表示等比例调节所有等效节点的大小;
步骤M4.4:根据不同聚类在力引导模型下的引力大小以及斥力大小,以及聚类等效节点,使用ForceAtlas2算法,得到聚类间的星系结构,并按预定格式进行存储;
所述力引导模型是指对图进行布局的一类布局算法;
所述步骤M5包括:
步骤M5.1:根据得到的星系结构与聚类内部布局结果,将步骤M2得到的图文件与步骤M3得到的图文件与星系结构进行融合,并将融合完成的图文件以预定格式存储;
步骤M5.2:使用python将融合完成的图文件转换为位图文件。

【专利技术属性】
技术研发人员:李琦贾雨葶李抒昊傅洛伊王新兵陈贵海
申请(专利权)人:上海交通大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1