本发明专利技术提供了一种基于文献耦合分析的社区划分系统及方法,属于社区划分方法技术领域。通过对参考文献、文章第一作者的处理和分析,形成以作者为节点、以作者间耦合关系为边的关系网络;在此基础上利用社区探测方法对关系网络进行社区划分,并进行耦合强弱程度的计算,用节点间连线粗细表示耦合强弱。本发明专利技术不仅能够更加直观地反映出各个作者研究方向的关联性,而且还能通过节点大小帮助研究人员了解和筛选领域内有影响力的作者,为广大研究人员的学术追踪提供方便。
A system and method of community division based on document coupling analysis
【技术实现步骤摘要】
一种基于文献耦合分析的社区划分系统及方法
本专利技术属于社区划分方法
,尤其涉及一种基于文献耦合分析的社区划分系统及方法。
技术介绍
在学术科研工作的过程中,已出版的大量文献是指导科研工作的重要资源。研究人员一般会根据自己的研究方向来选择相应的文章进行阅读、研究。但是随着研究的深入与相关文章发表的规模不断扩大,研究领域也会不断进行细化、新的子类以及交叉学科也会不断出现。面对文献数量及规模的增加,细分研究领域、了解领域有影响力的作者就成为了迫切的需求。然而,传统的人工细分方法不够全面而且也不能够凸显出在研究领域有足够影响力的作者,从而不能够对这些作者团队进行追踪,不利于对具有创新性要求的科研工作的展开。如何通过大量文献的相关数据将研究领域高效、准确地分成各个子类;同时找出该领域有影响力的作者,是有效使用学术资源的一个重要问题。
技术实现思路
针对现有技术中存在不足,本专利技术提供了一种基于文献耦合分析的社区划分系统及方法,对研究领域的大量文献进行处理分析,并形成不同的可视化社区,直观地表现这一领域的研究结构,表现出当前的研究领军人物同时也能为广大研究人员提供学术追踪。本专利技术是通过以下技术手段实现上述技术目的的。一种基于文献耦合分析的社区划分系统,包括依次信号连接的数据采集模块、数据预处理模块、关系网络获取模块、研究社区获取模块和显示模块;所述数据采集模块对文章中的参考文献信息进行采集并获取文章之间的耦合关系;所述数据预处理模块将文章之间的耦合关系转换为第一作者之间的耦合关系;所述关系网络获取模块建立第一作者关系网络;所述研究社区获取模块获取稳定社区,确定社区主题,确定节点间耦合强弱程度,获取领域内有影响力的作者;所述显示模块将研究社区以可视化的形式显示。一种基于文献耦合分析的社区划分方法,包括以下步骤:步骤(1):收集参考文献信息,获得不同文章间耦合关系、耦合强度;步骤(2):将文章之间耦合关系替换成第一作者间耦合关系,并建立作者关系网络;步骤(3):社区划分:采用社区探测方法对关系网络中的节点进行分配,形成稳定社区;确定社区研究主题,计算节点间耦合强弱程度,获取有影响力作者,并以可视化的形式将社区划分结果展出。进一步地,所述步骤(2)中作者关系网络以作者为节点,以作者之间的耦合关系为边。进一步地,所述步骤(3)中,在对关系网络节点进行分配之前,需要进行初始化,将每一个作者节点作为一个社区。进一步地,所述步骤(3)中对关系网络的分配分为两个阶段,第一阶段把网络中任意节点分配到其邻近节点的社区,同时计算分配前后的模块化增益;第二阶段根据模块化增益最大值的方向将相似的节点分配到同一社区,差异的节点相互远离,并在每一次分配过程中计算整个网络的模块度。进一步地,所述步骤(3)中稳定社区的形成需要对关系网络中的节点进行反复的两个阶段分配,直至整个网络的模块度达到最大值。进一步地,所述模块化增益ΔQ为:其中,∑in表示任一社区中连线权重;ki,in表示由节点i入射任一社区中的权重之和;ki表示节点i的度;∑tot表示关联到任一社区中的节点的连线权重之和;m表示网络连线权重之和。进一步地,所述模块度Q为:其中,i、j表示网络中任意两个节点,Aij为判别常数,当节点i、j直接相连时Aij=1,否则Aij=0;ki表示节点i的度;kj表示节点j的度;m表示网络连线权重之和;δ(CiCj)为判别常数,用来判断节点i,j是否在同一社区内,节点i,j在同一社区时δ(CiCj)=1,否则δ(CiCj)=0。进一步地,所述耦合强弱程度Sij为:其中:Wij表示任意两个节点i、j之间的耦合强度;∑Wij表示整个网络中的耦合强度之和;β为一个常数;Aij为判别常数,当节点i、j直接相连时Aij=1,否则Aij=0。进一步地,所述有影响力作者通过节点大小判断,节点越大,该作者影响力越大。本专利技术具有如下有益效果:与现有技术相比,本专利技术提出了一种基于文献耦合分析的社区划分系统及方法,该系统结构简单,通过对文章的参考文献进行处理分析,得到不同文章之间的耦合强度、耦合关系,并用第一作者间耦合关系代替文章间耦合关系,方便可视化图形的建立;本专利技术中根据作者耦合关系建立关系网络,进而基于此进行可视化社区划分,通过节点间线条粗细表示耦合强弱程度,划分更加全面,能够更加直观地反映出各个作者研究方向的关联性,而且能够通过节点大小凸显出研究领域有影响力的作者,进而有利于对作者团队进行追踪分析,推动科研工作的展开,帮助科研人员节省时间,高效广泛地利用学术资源。附图说明图1为本专利技术所述社区划分系统的结构示意图;图2为本专利技术所述社区探测方法流程图;图3为本专利技术所述关系网络示意图;图4为本专利技术所述社区划分示意图。具体实施方式下面结合附图以及具体实施例对本专利技术作进一步的说明,但本专利技术的保护范围并不限于此。图1是本专利技术所述基于文献耦合分析的社区划分系统的结构示意图,本实施例中的社区划分系统包括数据采集模块、数据预处理模块、关系网络获取模块、研究社区获取模块以及显示模块。数据采集模块对文章中的参考文献信息进行采集并处理;数据预处理模块与数据采集模块信号连接,对文章第一作者进行处理,并对数据采集模块传递过来的数据进行转换;关系网络获取模块与数据预处理模块信号连接,将数据预处理模块传递过来的数据进行处理并建立作者关系网络;研究社区获取模块与关系网络获取模块信号连接,采用社区探测方法对关系网络进行处理以得到一个稳定社区,并计算作者之间耦合强弱程度和作者节点的大小;显示模块与研究社区获取模块信号连接,将获得的研究社区以可视化的图片形式展示。本实施例中的基于文献耦合分析的社区划分方法具体包括以下步骤:步骤一:采集文章的参考文献信息,得出文章之间的耦合关系。将从网络上获取的多篇文章作为源数据导入数据采集模块,利用“CD”来表示每篇文章的参考文献,针对“CD”进行分离字段操作,获取每篇文章的参考文献信息,利用“Pi-Pj”来表示文章Pi与文章Pj共同引用了相同的参考文献,即文章之间的耦合关系。步骤二:获取N行第一作者之间的耦合关系。该步骤在数据预处理模块完成,以两篇文章之间引用相同参考文献的数量作为耦合强度,通过数据预处理模块中的分析共享单元和耦合共享单元确定文章之间耦合关系“Pi-Pj”的耦合强度,并选择N(N为正整数)行耦合强度为10以上的所有文章;识别所选取的文章的第一作者,并将步骤一中文章之间的耦合关系转换成第一作者之间的耦合关系,即分别识别文章Pi的第一作者Ai,文章Pj的第一作者Aj,将文章之间的耦合关系“Pi-Pj”替换为第一作者之间的耦合关系“Ai-Aj”;分别对N行文章之间的耦合关系进行逐行转换,得到N行第一作者之间的耦合关系。步骤三:建立作者关系网络。该步骤在关系网络获取模本文档来自技高网...
【技术保护点】
1.一种基于文献耦合分析的社区划分系统,其特征在于,包括依次信号连接的数据采集模块、数据预处理模块、关系网络获取模块、研究社区获取模块和显示模块;/n所述数据采集模块对文章中的参考文献信息进行采集并获取文章之间的耦合关系;/n所述数据预处理模块将文章之间的耦合关系转换为第一作者之间的耦合关系;/n所述关系网络获取模块建立第一作者关系网络;/n所述研究社区获取模块获取稳定社区,确定社区主题,确定节点间耦合强弱程度,获取领域内有影响力的作者;/n所述显示模块将研究社区以可视化的形式显示。/n
【技术特征摘要】
1.一种基于文献耦合分析的社区划分系统,其特征在于,包括依次信号连接的数据采集模块、数据预处理模块、关系网络获取模块、研究社区获取模块和显示模块;
所述数据采集模块对文章中的参考文献信息进行采集并获取文章之间的耦合关系;
所述数据预处理模块将文章之间的耦合关系转换为第一作者之间的耦合关系;
所述关系网络获取模块建立第一作者关系网络;
所述研究社区获取模块获取稳定社区,确定社区主题,确定节点间耦合强弱程度,获取领域内有影响力的作者;
所述显示模块将研究社区以可视化的形式显示。
2.一种基于文献耦合分析的社区划分方法,其特征在于,包括以下步骤:
步骤(1):收集参考文献信息,获得不同文章间耦合关系、耦合强度;
步骤(2):将文章之间耦合关系替换成第一作者间耦合关系,并建立作者关系网络;
步骤(3):社区划分:采用社区探测方法对关系网络中的节点进行分配,形成稳定社区;确定社区研究主题,计算节点间耦合强弱程度,获取有影响力作者,并以可视化的形式将社区划分结果展出。
3.根据权利要求2所述一种基于文献耦合分析的社区划分方法,其特征在于,所述步骤(2)中作者关系网络以作者为节点,以作者之间的耦合关系为边。
4.根据权利要求2所述一种基于文献耦合分析的社区划分方法,其特征在于,所述步骤(3)中,在对关系网络节点进行分配之前,需要进行初始化,将每一个作者节点作为一个社区。
5.根据权利要求4所述一种基于文献耦合分析的社区划分方法,其特征在于,所述步骤(3)中对关系网络的分配分为两个阶段,第一阶段把网络中任意节点分配到其邻近节点的社区,同时计算分配前后...
【专利技术属性】
技术研发人员:吴麟麟,王伟,景鹏,
申请(专利权)人:江苏大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。