交通运输领域变革性研究文献早期识别方法技术

技术编号:31022922 阅读:16 留言:0更新日期:2021-11-30 03:17
本发明专利技术涉及文献识别技术领域,具体地说,涉及一种交通运输领域变革性研究文献早期识别方法。其包括如下步骤:步骤S1、构建待识别数据集A;步骤S2、获取所述N篇文献的年度被引频次数据集B;步骤S3、计算获取每篇文献的Bcp指数;步骤S4、计算获取所述N篇文献的年度被引频次最大增量序列ΔC;步骤S5、计算获取所述N篇文献的总被引频次标准化数据集B';步骤S6,基于预定规则对所述N篇文献进行排序,进而筛选出M篇文献作为变革性研究文献。通过本发明专利技术能够较佳地对交通运输领域的变革性研究文献进行早期识别。行早期识别。行早期识别。

【技术实现步骤摘要】
交通运输领域变革性研究文献早期识别方法


[0001]本专利技术涉及文献识别
,具体地说,涉及一种交通运输领域变革性研究文献早期识别方法。

技术介绍

[0002]在创新驱动发展战略中,制定科学、合理的科技规划和科技政策是建立创新型社会的关键。在科技规划和科技政策中,如何快速,准确地预测未来科技热点、发展趋势尤为关键。科技政策制定中最重要的挑战始终是如何选择“正确的”未来技术,预测未来的社会需求。技术预测有助于发现未来关键的科技领域和科技技术,预测未来的社会需求,使研发工作与社会需求保持一致,在此基础上,制定可持续发展的科技规划、政策,为全社会的科技工作提供前瞻性的指导。
[0003]技术预测是对科技发展的未来目标和可能途径及资源条件做出的预先推测或测定。技术预测主要着眼于准确地预言、推测未来的技术发展动向,强调如何适应未来的发展趋势,是为适应未来提供决策依据。通过一定的方法提前发现未来能够引起范式转变或开辟新的前沿的研究,则可以认为在一定程度上实现了某一领域的预测。未来能够引起范式转变或开辟新的前沿的研究即为变革性研究,识别变革性研究是实现技术预测的一个重要方面。
[0004]科学界普遍有这样一种共识“论文的影响和学术水平其实不是一回事,好的科研往往独辟蹊径,所出的成果需要过一段时间甚至很多年以后才会慢慢被主流接受,在短期引用率上反映不出来”。根据科学发展的自身规律,真正好的、创新性的研究(变革性研究)总是少数人开创的、容易被忽视或抵制、开始阶段不可能纷纷跟风涌入的。高品质、重大原创性论文(变革性的研究产出)往往会有一个“沉睡期”,会遭遇延迟承认,科学研究中的延迟承认现象又被称之为睡美人现象。故基于该种延迟承认的现象,当前很难对变革性研究进行早期识别。

技术实现思路

[0005]本专利技术提供了一种交通运输领域变革性研究文献早期识别方法,其能够克服现有技术的某种或某些缺陷。
[0006]根据本专利技术的交通运输领域变革性研究文献早期识别方法,其包括如下步骤:
[0007]步骤S1、构建待识别数据集A
[0008]该步骤中,待识别数据集A={A
i
|i∈[1,N]},待识别数据集A表示自n本期刊中所选取相关领域的N篇文献,A
i
为第i篇文献;
[0009]步骤S2、获取所述N篇文献的年度被引频次数据集B
[0010]该步骤中,B={B
i
|i∈[1,N]},B
i
表示第i篇文献的被引频次数列,B
i
={B
it
|i∈[1,N],t∈[t
i0
,t
n
]},B
it
表示第i篇文献在第t年度的被引频次;t
i0
表示第i篇文献的发表当年,t
n
表示当前年度;
[0011]步骤S3、计算获取每篇文献的B
cp
指数
[0012]该步骤中,对应第i篇文献,其B
cp
指数为B
cpi

[0013]步骤S4、计算获取所述N篇文献的年度被引频次最大增量序列ΔC
[0014]该步骤中,ΔC={ΔC
i
|i∈[1,N]},ΔC
i
表示第i篇文献的年度被引频次最大增量,其中,B

i
为第i篇文献的在区间[t
i0
,t
n
]中的总被引频次,
[0015]步骤S5、计算获取所述N篇文献的总被引频次标准化数据集B

[0016]该步骤中,B

={B

i
|i∈[1,N]},B

i
表示第i篇文献的总被引频次经标准化处理后的数值,其中,μ为所述N篇文献的总被引频次的均值,σ为所述N篇文献的总被引频次的标准差;
[0017]步骤S6,基于预定规则对所述N篇文献进行排序,进而筛选出M篇文献作为变革性研究文献。
[0018]通过本专利技术中的方法,能够首先自现有文献库中筛选出N篇文献,之后能够对每篇文献的B
cp
指数、年度被引频次最大增量及总被引频次标准化数据进行计算获取,之后能够基于预定的规则对变革性研究文献进行早期识别,故而能够较佳地提供一种较为科学的变革性研究文献早期识别方法,故而便于运用。
[0019]作为优选,步骤S3中具体包括如下步骤,
[0020]步骤S31,计算获取每篇文献的年度被引频次累积百分比集合C,C={C
i
|i∈[1,N]},C
i
表示第i篇文献的年度被引频次累积百分比数列;C
i
={C
ti
|i∈[1,N],t∈[t
i0
,t
n
]},C
ti
表示第i篇文献在第t年度的年度被引频次累积百分比,
[0021]步骤S32,根据公式获取每篇文献的B
cp
指数。
[0022]通过上述,即可较佳地获取每篇文献的B
cp
指数,其中,对去每篇文献,其发表年份t
i0
能够定义为0,故而能够能够较佳地便于B
cp
指数的计算。
[0023]作为优选,步骤S6具体包括如下步骤,
[0024]步骤S61,建立规则集合P,P={P
j
|j=1,2,3,

Q},P
j
表示第j条规则,Q为规则集合P的元素总数;
[0025]步骤S62,基于规则集合P将所述N篇文献划分为Q组;
[0026]步骤S63,按B
cp
指数自大到小的顺序自每组文献中筛选出M/Q篇文献作为变革性研究文献。
[0027]通过上述,能够基于不同的规则将N篇文献划分为多组,且能够自没组文献中均筛选出排序靠前的M/Q篇文献,从而形成M篇变革性研究文献;基于此种方法,能够较佳地自不同特征类别的文献中均进行变革性研究文献的识别,故而能够较佳地提升文献早期识别的精确性。
[0028]作为优选,步骤S61中,规则集合P中共有4条规则,即Q=4;其中,
[0029][0030][0031][0032][0033]通过构建规则P1和规则P2,能够较佳地基于3σ准则,对文献进行分类,从而能够充分保障大部分的文献均能够被列入识别的列表中。
[0034]通过构建规则P3,能够较佳地对当前年份近2年内达到被引频次最大值的文献进行早期识别,故而能够较佳地对当前较为热门的文献进行筛选识别。
[0035]通过构建规则P4,能够较佳地基于3σ准则,对在当前年份的近2年内达到年度被引频次最大增量的文献进行早期识别,故而能够较佳地对当前较为热门的文献进行筛选识别。
[0036]作为优选,步骤S2中,所构建的年本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.交通运输领域变革性研究文献早期识别方法,其包括如下步骤:步骤S1、构建待识别数据集A该步骤中,待识别数据集A={A
i
|i∈[1,N]},待识别数据集A表示自n本期刊中所选取相关领域的N篇文献,A
i
为第i篇文献;步骤S2、获取所述N篇文献的年度被引频次数据集B该步骤中,B={B
i
|i∈[1,N]},B
i
表示第i篇文献的被引频次数列,B
i
={B
it
|i∈[1,N],t∈[t
i0
,t
n
]},B
it
表示第i篇文献在第t年度的被引频次;t
i0
表示第i篇文献的发表当年,t
n
表示当前年度;步骤S3、计算获取每篇文献的B
cp
指数该步骤中,对应第i篇文献,其B
cp
指数为B
cpi
;步骤S4、计算获取所述N篇文献的年度被引频次最大增量序列ΔC该步骤中,ΔC={ΔC
i
|i∈[1,N]},ΔC
i
表示第i篇文献的年度被引频次最大增量,其中,B

i
为第i篇文献的在区间[t
i0
,t
n
]中的总被引频次.步骤S5、计算获取所述N篇文献的总被引频次标准化数据集B

该步骤中,B

={B

i
|i∈[1,N]},B

i
表示第i篇文献的总被引频次经标准化处理后的数值,其中,μ为所述N篇文献的总被引频次的均值,σ为所述N篇文献的总被引频次的标准差;步骤S6,基于预定规则对所述N篇文献进行排序,进而筛选出M篇文献作为变革性研究文献。2.根据权利要求1所述的交通运输领域变革性研究文献早期识别方法,其特征在于:步骤S3中具体包括如下步骤,步骤S31,计算获取每篇文献的年度被引频次累积百分比集合C,C={C
i
|i∈[1,N]},C
i
表示第i篇文献的年度被引频次累积百分比数列;C
i
={C
ti
|i∈[1,N],t∈[t
i0
,t
n
]},C
ti
表示第i篇文献在第t年度的年度被引频次累积百分比,步骤S32,根据公式获取每篇文献的B
cp
指数。3.根据权利要求1所述的交通运输领域变革性研究文献早期识别方法,其特征在于:步骤S6具体包括如下步骤,步骤S61,建立规则集合P,P={P
...

【专利技术属性】
技术研发人员:林垚郑春晓张丽张晗郭瑜秦晓燕孙逸帆周紫君刘思范煜君张亚赵正松杨文娟
申请(专利权)人:中国科学院文献情报中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1