基于自适应相似性度量的技术发展阶段判断方法与系统技术方案

技术编号:33951061 阅读:11 留言:0更新日期:2022-06-29 22:26
本申请提出一种基于自适应相似性度量的技术发展阶段判断方法与系统,该方法包括:对高德纳曲线进行分割,定义多个技术发展阶段;在预设的数据集中搜索技术关键词,生成表示技术关键词对应的科技数据的数量随时间变化的时序数据并进行预处理;基于预设的细节分辨率对预处理后的时序数据进行子序列划分,连接各个子序列生成主序列,并将主序列转换为三元组的形式;通过动态时间扭曲将主序列与代表各个技术发展阶段的曲线进行相似性度量;将相似性程度最高的技术发展阶段判定为该技术所处的发展阶段。该方法基于高德纳技术成熟度曲线和相似性度量对技术发展阶段进行多尺度的判断,提高了对技术发展阶段进行判定的准确性、适用性和科学性。性和科学性。性和科学性。

【技术实现步骤摘要】
基于自适应相似性度量的技术发展阶段判断方法与系统


[0001]本申请涉及信息处理
,尤其涉及一种基于自适应相似性度量的技术发展阶段判断方法与系统。

技术介绍

[0002]随着科学技术的发展,科技战略研究越来越受到人们的重视,对不同领域的科学技术进行评估具有重要的实际意义。目前,科学技术评估方法已经由传统的定性分析方法向定量分析、定性与定量结合的分析方法转变,在以往的研究中,通常是利用德尔菲法、层次分析法和情景分析法等传统方法分析特定领域技术发展状况,该类方法对专家知识的依赖性较强,需要根据经验进行判断,虽然分析结果的领域权威性和专业性能够得到保障,但任务实现的客观性、一致性和全面性较差。而在当前发展时期下,新兴技术层出不穷,科技情报需求也更加动态多样,随着数据资源的迅猛发展和人工智能技术的进步,定量方法逐渐应用于技术分析中,将科技数据(比如,论文等)与统计学习方法相结合的技术分析方法为科技评估创造了更多的可能性。
[0003]其中,技术成熟度曲线(The Hype Cycle)是由高德纳(Gartner)咨询公司创建的一种用来评估新科技的可见度,确定是否采用新科技的工具,高德纳曲线(Gartner Hype cycle)是定性与定量相结合实现技术成熟度评估的重要方法,基于Hype Cycle发布的新兴技术成熟度方法层出不穷,成为技术评估领域重要的基础原理与工具。根据把握领域技术发展态势、客观评估技术成熟度和合理选择技术介入时机等实际需求,结合Hype Cycle可以研究与制定相关实施方案对技术的成熟程度及发展阶段进行评定。
[0004]然而,Hype Cycle的生成需要依靠大量的专家和领域知识,在实际应用中面向不同应用场景时,很难应用该方法把握技术发展的进程,实现对技术成熟度、技术发展阶段乃至整个领域的个性化和定量化评估,并且,由于不同领域技术发展周期时间尺度不同,相关技术中的基于Hype Cycle的技术发展阶段评估方法,评估的科学性、客观性和准确性均较低。

技术实现思路

[0005]本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
[0006]为此,本申请的第一个目的在于提出一种基于自适应相似性度量的技术发展阶段判断方法,该方法基于高德纳技术成熟度曲线、自适应的时序数据特征提取算法和相似性度量对技术发展阶段进行多尺度的判断,通过人工调整阈值,控制算法细节特征提取粒度,实现科技成果时序数据自适应处理,并将处理后的时序数据与高德纳曲线进行比对实现技术发展阶段判定,提高了对技术发展阶段进行判定的准确性、适用性和科学性。
[0007]本申请的第二个目的在于提出一种基于自适应相似性度量的技术发展阶段判断系统。
[0008]本申请的第三个目的在于提出一种非临时性计算机可读存储介质。
[0009]为达上述目的,本申请的第一方面实施例提出了一种基于自适应相似性度量的技术发展阶段判断方法,包括以下步骤:
[0010]对高德纳曲线进行分割,定义多个技术发展阶段,其中,每个所述技术发展阶段包括所述高德纳曲线中相邻的两个时期;
[0011]在预设的数据集中搜索技术关键词,根据搜索结果生成表示所述技术关键词对应的科技数据的数量随时间变化的时序数据,并对所述时序数据进行预处理;
[0012]基于预设的细节分辨率对所述预处理后的时序数据进行子序列划分,连接各个所述子序列生成主序列,以实现所述预处理后的时序数据的特征提取,并将所述主序列转换为三元组的形式存储;
[0013]通过动态时间扭曲DTW将转换后的主序列与代表各个所述技术发展阶段的曲线进行相似性度量,并对所述转换后的主序列与每个所述技术发展阶段的相似性程度进行排序;
[0014]将相似性程度最高的技术发展阶段判定为所述时序数据表示的技术所处的目标技术发展阶段。
[0015]可选地,在本申请的一个实施例中,基于预设的细节分辨率对所述预处理后的时序数据进行子序列划分,包括:
[0016]S1:设置所述标准化处理后的时序数据为目标序列;
[0017]S2:将所述目标序列的首尾两个端点标记为第一关键点,连接所述首尾两个端点生成基准线;
[0018]S3:计算所述目标序列中除所述首尾两个端点之外的每个数据点至所述基准线的垂直距离,并在全部垂直距离中筛选出最大距离,确定所述最大距离对应的数据点;
[0019]S4:基于所述细节分辨率确定对应的分辨率距离,将所述最大距离与所述分辨率距离进行比较,若所述最大距离大于所述分辨率距离,则将所述最大距离对应的数据点标记为第二关键点,并根据所述第二关键点将所述目标序列分割为第一子序列和第二子序列;
[0020]S5:分别将所述目标序列更新为每个重新划分出的子序列,针对每个更新后的目标序列重复执行步骤S2至步骤S4,直至不再产生新的子序列。
[0021]可选地,在本申请的一个实施例中,基于所述细节分辨率确定对应的分辨率距离,包括:
[0022]在所述全部垂直距离中筛选出最大距离和最小距离;
[0023]通过以下公式计算所述分辨率距离:
[0024][0025]其中,Reso是预设的细节分辨率,distance
max
是最大距离,distance
min
是最小距离,distance
Reso
是分辨率距离。
[0026]可选地,在本申请的一个实施例中,将所述主序列转换为三元组的形式存储,包括:计算每个所述子序列包含的数据点的均值;计算每个所述子序列首尾两个端点的连线的斜率;确定每个所述子序列的首端点在所述目标序列中的索引,根据每个所述子序列的索引、均值和斜率将对应的子序列表示为三元组。
[0027]可选地,在本申请的一个实施例中,通过动态时间扭曲DTW将所述主序列与每个所述技术发展阶段进行相似性度量,包括:将每个所述技术发展阶段对应的序列段转换为三元组形式;根据所述转换后的主序列和任一转换后的技术发展阶段对应的序列段构建距离矩阵,并通过动态时间扭曲DTW确定所述距离矩阵的最优路径;根据所述最优路径将所述转换后的主序列和所述任一转换后的技术发展阶段对应的序列段中的三元组进行对齐,并计算对齐后的每两个相对应的三元组之间的距离;计算全部距离的和,以所述和为所述主序列与所述任一转换后的技术发展阶段的相似性。
[0028]可选地,在本申请的一个实施例中,通过以下公式计算对齐后的每两个相对应的三元组之间的距离:
[0029][0030]其中,M1和M2分别表示每两个相对应的三元组的均值,q1和q2分别表示每两个相对应的三元组的斜率。
[0031]可选地,在本申请的一个实施例中,对所述时序数据进行预处理,包括:对所述时序数据进行Z

Score标准化处理。
[0032]为达上述目的,本申请的第二方面实施例提出了一种基于自适应相似性度量的技术发展阶段判断系统,包括以下模块:
[0033]定义模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自适应相似性度量的技术发展阶段判断方法,其特征在于,包括以下步骤:对高德纳曲线进行分割,定义多个技术发展阶段,其中,每个所述技术发展阶段包括所述高德纳曲线中相邻的两个时期;在预设的数据集中搜索技术关键词,根据搜索结果生成表示所述技术关键词对应的科技数据的数量随时间变化的时序数据,并对所述时序数据进行预处理;基于预设的细节分辨率对所述预处理后的时序数据进行子序列划分,连接各个所述子序列生成主序列,以实现所述预处理后的时序数据的特征提取,并将所述主序列转换为三元组的形式存储;通过动态时间扭曲DTW将转换后的主序列与代表各个所述技术发展阶段的曲线进行相似性度量,并对所述转换后的主序列与每个所述技术发展阶段的相似性程度进行排序;将相似性程度最高的技术发展阶段判定为所述时序数据表示的技术所处的目标技术发展阶段。2.根据权利要求1所述的判断方法,其特征在于,所述基于预设的细节分辨率对所述预处理后的时序数据进行子序列划分,包括:S1:设置所述标准化处理后的时序数据为目标序列;S2:将所述目标序列的首尾两个端点标记为第一关键点,连接所述首尾两个端点生成基准线;S3:计算所述目标序列中除所述首尾两个端点之外的每个数据点至所述基准线的垂直距离,并在全部垂直距离中筛选出最大距离,确定所述最大距离对应的数据点;S4:基于所述细节分辨率确定对应的分辨率距离,将所述最大距离与所述分辨率距离进行比较,若所述最大距离大于所述分辨率距离,则将所述最大距离对应的数据点标记为第二关键点,并根据所述第二关键点将所述目标序列分割为第一子序列和第二子序列;S5:分别将所述目标序列更新为每个重新划分出的子序列,针对每个更新后的目标序列重复执行步骤S2至步骤S4,直至不再产生新的子序列。3.根据权利要求2所述的判断方法,其特征在于,所述基于所述细节分辨率确定对应的分辨率距离,包括:在所述全部垂直距离中筛选出最大距离和最小距离;通过以下公式计算所述分辨率距离:其中,Reso是预设的细节分辨率,distance
max
是最大距离,distance
min
是最小距离,distance
Reso
是分辨率距离。4.根据权利要求1所述的判断方法,其特征在于,所述将所述主序列转换为三元组的形式存储,包括:计算每个所述子序列包含的数据点的均值;计算每个所述子序列首尾两个端点的连线的斜率;确定每个所述子序列的首端点在所述目标序列中的索引,根据每个所述子序列的索引、均值和斜率将对应的子序列表示为三元组。5.根据权利要求1所述的判断方法,其特征在于,所述通过动态时间扭曲DTW将所述主
序列与每个所述技术发展阶段进行相似性度量,包括:将每个所述技术发展阶段对应的序列段转换为三元组形式;根据所述转换后的主序列和任一转换后的技术发展阶段对应的序列段构建距离矩阵,并通过动态...

【专利技术属性】
技术研发人员:褚晓泉李青仇瑜刘德兵唐杰赵慧军席天天
申请(专利权)人:北京智谱华章科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1