一种利用复杂网络进行学科热点识别的方法技术

技术编号:27137976 阅读:19 留言:0更新日期:2021-01-27 20:41
本发明专利技术属于计量学领域,利用复杂网络分析法在学科领域热点识别及发展阶段评估的应用。主要技术实施方案是通过定义学科发展阶段指标K,并建立动态网络增长模型,对学科领域中一段时间内的文献进行数据分析和网络构建,最终确定学科发展阶段,推测学科未来发展趋势,并进一步给出学科发展建议。该方法可以实现学科发展阶段的可靠评估,可以应用在不同学科领域,透视学科发展。透视学科发展。

【技术实现步骤摘要】
一种利用复杂网络进行学科热点识别的方法


[0001]本专利技术是一种针对学科共词网络的建模方法,属于复杂网络分析领域。

技术介绍

[0002]科学计量学是信息科学的一个分支,国内外通常使用科学计量学进行研究趋势的透视与挖掘。该方法被广泛的应用于图书馆学与数据挖掘工作之中。众多的研究表明,科学计量学能够很好的揭示一个学科的发展规律,透视其热点变化趋势。在大数据的信息时代,科学计量学更是从整体出发,定性、定量地分析学科研究趋势和研究热点必不可少的工具。
[0003]复杂网络规模大、维数高,具有鲁棒性、随机性、非线性、不规则时空尺度等特点。它不仅包含于各种现实的物理网络,如电网、交通网络、通信网络等,而且也能刻画抽象的逻辑关系,如金融网络、社交网络、只是网络等。复杂网络作为一种研究方式被广泛应用于各个领域,诸如化学、数学、计量学、工程学、金融学和社会科学等,成为许多交叉学科实现新突破的有效助力。
[0004]科学的发展是交替进行的。托马斯
·
库恩在1962年提出了科学范式理论,认为科学发展的本质是“范式”的交替,即新的科学概念和理论通过对原有概念和理论的替代、包含、发展和补充实现科学的交替。科学的发展可以分为三个阶段:前科学革命期,科学范式期和危机期。众多的学科在此著名的科学-哲学理论的指导下循环往复地演化发展着。

技术实现思路

[0005]本专利技术基于文献数据,借助复杂网络分析建模方法,并通过科学计量学的理论,提出通过K指标作为对学科共词网络发展情况的描述系数,实现其作为学科整体测度的功能,进而为科学研究工作提供整体参考。
[0006]本专利技术以文献关键词数据为基础,提出用量化科学范式理论的K指标作为系数,对知识网络的增长模式进行了节点增长的动力学解析,建立具有动态调整的共词网络增长模型。
[0007]本专利技术提供的一种利用复杂网络进行学科增长模式模拟的方法,包括有以下步骤:
[0008]1.定义K指标
[0009]一篇文章中,由作者给出的关键词可以被看作是一篇文章内容的高度浓缩,且一个关键词通常代表着一个特定的概念。因此,存在描述集合中关键词的两个参数——关键词频次(Keyword Frequency,KF)和关键词计数(Keyword Counting,KC)。
[0010]一个学科的持续发展,都是由知识的相互交流推动的,而这种交流则需要通过科技论文的不断发表实现。在这个过程中,关键词集合中KF和KC的值也会随之变化。然而,不同的学科有时会拥有截然不同的学科规模(PublicationAmount,A),从而造成这KF和KC的绝对数量在学科间可能存在巨大的差异,进而难以比较或比较起来没有意义。因此,通过将这两个变量对学科规模进行正规化,得到两个可以在学科间比较的参数——KFA、KCA:
[0011][0012][0013]对于某特定学科,KFA指平均每篇文献列出的关键词的个数,KCA指平均每篇文献拥有能够代表独立概念的关键词的个数。随着文章的不断发表,KCA与KFA间的比值会不断的改变,它们反映着一个学科的概念逐步达到共识的过程:当某个学科中没有任何达成的共识,他们的比值会是1,即隶属此学科的关键词集合中的任意一个关键词都仅出现过一次,每个关键词都代表着作者不同于他人的主张;当此学科达到了完全的共识,即所有发表的文章都选用相同的关键词,KCA与KFA的比值则会随着文章发布量的增长最终趋近于0。由此,本专利技术提出用K指标:
[0014][0015]K是一个在1到0之间变动的无量纲参数,作为学科共词网络增长的调整系数,实现学科共词网络增长模式的模型的构建。
[0016]2.知识网络的增长模式
[0017]共词网络在对一个学科中知识结构的抽象与呈现过程中扮演重要的角色,一般来说,一个学科的共词网络即为此学科的知识网络。在一个共词网络中,每个节点代表唯一的关键词,节点之间的连接表示两个关键字的共同出现,即出现在一篇文章中。因此,一篇文章中的几个关键词均会两两相连。一个学科的关键词集合的增大(不论是KF还是KC的变化),均以文章为载体,所以在共词网络的增长过程中,需要考虑一个学科中的每篇新增文章中的关键词在学科整体的关键词集合中是否存在过,并据此为共词网络中对新兴的关键词创建新的节点,进而模拟网络节点数目的增长。
[0018]由K指标的定义((3)式)可以发现,虽然其作为一个宏观变量从整体上描述学科的发展阶段,但其微观意义在于描述一个学科的文献中,平均每篇文章的关键词与已有关键词重复的比率。由于K通过整个关键词集合统计求得,是一个复杂系统统计特性的反映,具有一定的鲁棒性。因此,本专利技术认为基于已有数据求得的K能够代表即将加入学科的文章中关键词的重复比率。一个学科的共词网络会在其发展过程中,根据不同的K有不同的增长表现(图1):假设学科中在已有共词网络基础上,又有一篇文章发表,这篇文章带有的若干关键词(假设为5个)与已有关键词集合的重复比率,便可认为等于K。
[0019]随着学科的不断演化,学科规模与内涵会不断变化。一方面,在此过程中,总有一些关键词或概念会被作为识别某个学科的特征,并以此作为此学科的基础;另一方面,跟着学科内在的不断扩张,其学科外延也会持续增长,导致学科内的创新或学派的分化。因此,一个知识网络可以看作网络的基础部分与网络的增长部分相互耦合的结果。在此过程中,基础部分会对整个知识体系产生由内而外的“激发作用”,促使网络的增长;而已经存在的网络,不论网络的基础部分还是增长部分都会对知识的传递产生由外而内的“阻碍作用”。二者的相互耦合便会推动学科的演化发展,耦合的结果即指示一个学科特定的发展阶段。因此,本专利技术根据两种作用的相互耦合提出共词网络的动态调整增长模型,并将K作为了知识网络增长的动态调整参数。
[0020]2.建立动态调整的知识网络增长模型
[0021]对于一个学科的知识网络,观察者总会在一个特定的时间段内进行观测。由于知识网络中的各种知识具有传承与累积的效应,因此以实际观测数据,根据式(4)求得其总体增长率r:
[0022]n
t
=n0(1+r)
t
,t=1,2,
…ꢀꢀꢀꢀꢀꢀ
(4)
[0023]式中,将初始观测作为第0时间步,则n0表示初始网络规模,n
t
表示最终网络规模,t表示增长步数。r可以用来表示网络中的“激发作用”,网络中的“阻碍作用”通过计算每个时间间隔的累积数据中的K值获得。
[0024]给出观测时间段0~t,初始为第0时间步,初始网络节点数为n0,网络节点数会在增长率r下增长。这里的r可以看作由基础网络向外的“激发作用”,但由于网络自身所造成的“阻碍作用”,会使得激发作用有所减弱。因此,此处将通过初始网络所得的K作为“阻碍作用”,进而得到动态调整的网络增长模型。对于第一个时间步0

1而言,网络的增长部分为:
[0025]Δn1=n0*(1+r*K0)
ꢀ本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.定义K指标根据关键词频次(Keyword Frequency,KF)和关键词计数(Keyword Counting,KC)及学科规模(Publication Amount,A),定义参数——KFA、KCA:Amount,A),定义参数——KFA、KCA:KFA指平均每篇文献列出的关键词的个数,KCA指平均每篇文献拥有能够代表独立概念的关键词的个数。从而进一步定义K指标:K是一个在1到0之间变动的无量纲参数,作为学科共词网络增长的调整系数,实现学科共词网络增长模式的模型的构建。2.建立动态调整的知识网络增长模型对于一个学科的知识网络,观察者总会在一个特定的时间段内进行观测。由于知识网络中的各种知识具有传承与累积的效应,因此以实际观测数据,根据式(4)求得其总体增长率r:n
t
=n0(1+r)
t
,t=1,2,
…ꢀꢀꢀꢀꢀꢀꢀꢀ
(4)式中,将初始观测作为第0时间步,则n0表示初始网络规模,n
t
表示最终网络规模,t表示增长步数。r可以用来表示网络中的“激发作用”,网络中的“阻碍作用”通过计...

【专利技术属性】
技术研发人员:刘天禹曹占平
申请(专利权)人:天津工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1