一种主路径分析方法及装置制造方法及图纸

技术编号:38481676 阅读:12 留言:0更新日期:2023-08-15 16:59
本申请涉及一种主路径分析方法及装置,方法包括:获取引文网络中源节点、汇节点和过程节点的节点分布信息;在节点分布信息满足预设分布条件的情况下,屏蔽引文网络中特定节点所连接的边,以得到引文网络的子网络,特定节点包括源节点和/或汇节点;保存特定节点的引用关系;获取子网络的第一主路径,并利用保存的特定节点的引用关系,在第一主路径中补充与第一主路径相关的引用关系,以得到引文网络的主路径,由此,在分析引文网络的主路径过程中,不需要计算特定节点所连接的边的权重,减少了计算量,从而降低主路径分析的耗时。并且在第一主路径上补充引文网络的特定节点和恢复了部分特定节点相连的引用关系,保证了主路径的完整性。整性。整性。

【技术实现步骤摘要】
一种主路径分析方法及装置


[0001]本申请涉及数据处理
,特别涉及一种主路径分析方法及装置。

技术介绍

[0002]引文网络是由文献资料间引用和被引用的关系构成的一个有向无环图(Directed Acyclic Graph,DAG),这些文献资料包括科技期刊、专利文献、会议论文集、科技报告和学位论文等。其中,每个文献资料作为引文网络中的一个节点,节点之间通过文献资料间的引用和被引用关系进行连接,以形成引文网络中两个节点之间的边。
[0003]在构建出引文网络后,利用主路径分析方式从引文网络中提取出用于体现技术发展主体脉络(也可以称为技术发展方向)的主路径。主路径分析方法主要是计算引文网络中每条边的权重,基于每条边的权重从引文网络中提取出主路径。但是,主路径分析方法存在耗时长的问题。

技术实现思路

[0004]本申请提供一种主路径分析方法及装置,用于在降低主路径分析的耗时的同时保证主路径的完整性。为实现上述目的,本申请提供如下技术方案:第一方面,本申请提供一种主路径分析方法,所述方法包括:获取引文网络中源节点、汇节点和过程节点的节点分布信息;在所述节点分布信息满足预设分布条件的情况下,屏蔽所述引文网络中特定节点所连接的边,以得到所述引文网络的子网络,所述特定节点包括所述源节点和/或汇节点;保存所述特定节点的引用关系,所述特定节点的引用关系用于得到特定节点所连接的边;获取所述子网络的第一主路径,并利用保存的所述特定节点的引用关系,在所述第一主路径中补充与所述第一主路径相关的引用关系,以得到所述引文网络的主路径。
[0005]可选的,所述方法还包括:利用所述主路径中的节点和边,构建主路径网络;获取所述主路径网络的第二主路径;若所述第二主路径与所述主路径不匹配,将所述主路径更新为所述第二主路径。
[0006]可选的,所述若所述第二主路径与所述主路径不匹配,将所述主路径更新为所述第二主路径包括:若所述第二主路径与所述主路径不匹配,利用所述第二主路径中的节点和边,构建新的主路径网络,并获取所述新的主路径网络的第三主路径;若所述第三主路径与所述第二主路径匹配,将所述主路径更新为所述第二主路径;若所述第三主路径与所述第二主路径不匹配,将所述第二主路径更新为所述第三主路径,利用更新后的所述第二主路径中的节点和边,再次构建新的主路径网络,并获取再
次构建的主路径网络的第三主路径,直至再次构建的主路径网络的第三主路径与更新后的所述第二主路径匹配,将所述主路径更新为所述更新后的所述第二主路径。
[0007]可选的,所述利用所述主路径中的节点和边,构建主路径网络包括:在接收到用户触发了再次提取主路径的操作后,利用所述主路径中的节点和边,构建所述主路径网络;或者在所述主路径的路径参数满足预设主路径分析条件的情况下,利用所述主路径中的节点和边,构建所述主路径网络,其中所述路径参数包括所述过程节点在所述主路径中的占比、所述主路径中的节点数量和主路径总数中的至少一种参数。
[0008]可选的,所述利用保存的所述特定节点的引用关系,在所述第一主路径中补充与所述第一主路径相关的引用关系,以得到所述引文网络的主路径包括:在所述特定节点包括所述源节点的情况下,利用所述源节点的引用关系,确定所述第一主路径中的起点所引用的所有源节点,基于所述所有源节点中各源节点的出度,选择添加至所述第一主路径中的源节点并恢复该源节点与所述第一主路径中的起点之间的边关系;和/或在所述特定节点包括所述汇节点的情况下,利用所述汇节点的引用关系,确定引用所述第一主路径中的终点的所有汇节点,基于所述所有汇节点中各汇节点的入度,选择添加至所述第一主路径中的汇节点并恢复该汇节点与所述第一主路径中的终点之间的边关系。
[0009]可选的,所述在所述节点分布信息满足预设分布条件的情况下,屏蔽所述引文网络中特定节点所连接的边,以及保存所述特定节点的引用关系包括:在所述源节点在所述引文网络中的占比大于所述过程节点在所述引文网络中的占比的情况下,屏蔽所述源节点所连接的边,并保存所述源节点的引用关系;和/或在所述汇节点在所述引文网络中的占比大于所述过程节点在所述引文网络中的占比的情况下,屏蔽所述汇节点所连接的边,并保存所述汇节点的引用关系。
[0010]第二方面,本申请提供一种主路径分析装置,所述装置包括:第一获取单元,用于获取引文网络中源节点、汇节点和过程节点的节点分布信息;屏蔽单元,用于在所述节点分布信息满足预设分布条件的情况下,屏蔽所述引文网络中特定节点所连接的边,以得到所述引文网络的子网络,所述特定节点包括所述源节点和/或汇节点;保存单元,用于保存所述特定节点的引用关系,所述特定节点的引用关系用于得到特定节点所连接的边;第二获取单元,用于获取所述子网络的第一主路径;补充单元,用于利用保存的所述特定节点的引用关系,在所述第一主路径中补充与所述第一主路径相关的引用关系,以得到所述引文网络的主路径。
[0011]可选的,所述装置还包括:构建单元,用于利用所述主路径中的节点和边,构建主路径网络;
第三获取单元,用于获取所述主路径网络的第二主路径;更新单元,用于若所述第二主路径与所述主路径不匹配,将所述主路径更新为所述第二主路径。
[0012]可选的,所述补充单元,用于在所述特定节点包括所述源节点的情况下,利用所述源节点的引用关系,确定所述第一主路径中的起点所引用的所有源节点,基于所述所有源节点中各源节点的出度,选择添加至所述第一主路径中的源节点并恢复该源节点与所述第一主路径中的起点之间的边关系;和/或在所述特定节点包括所述汇节点的情况下,利用所述汇节点的引用关系,确定引用所述第一主路径中的终点的所有汇节点,基于所述所有汇节点中各汇节点的入度,选择添加至所述第一主路径中的汇节点并恢复该汇节点与所述第一主路径中的终点之间的边关系。
[0013]第三方面,本申请提供一种存储介质,所述存储介质中存储有程序,所述程序被处理器执行时实现上述主路径分析方法。
[0014]由以上技术方案可知,在引文网络的节点分布信息满足预设分布条件的情况下,屏蔽特定节点所连接的边,以得到引文网络的子网络,这样子网络的节点数量大大减少,并且在获取子网络的第一主路径的过程中有效减少了计算量。在得到子网络的第一主路径之后,利用保存的特定节点的引用关系,在第一主路径中补充与第一主路径相关的引用关系,从而得到引文网络的主路径。由此,在分析引文网络的主路径过程中,不需要计算特定节点所连接的边的权重,减少了计算量,从而降低主路径分析的耗时。并且在第一主路径上补充了与第一主路径相关的引用关系,使得引文网络的主路径是信息完整的路径,保证了主路径的完整性。
附图说明
[0015]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种主路径分析方法,其特征在于,所述方法包括:获取引文网络中源节点、汇节点和过程节点的节点分布信息;在所述节点分布信息满足预设分布条件的情况下,屏蔽所述引文网络中特定节点所连接的边,以得到所述引文网络的子网络,所述特定节点包括所述源节点和/或汇节点;保存所述特定节点的引用关系,所述特定节点的引用关系用于得到特定节点所连接的边;获取所述子网络的第一主路径,并利用保存的所述特定节点的引用关系,在所述第一主路径中补充与所述第一主路径相关的引用关系,以得到所述引文网络的主路径。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:利用所述主路径中的节点和边,构建主路径网络;获取所述主路径网络的第二主路径;若所述第二主路径与所述主路径不匹配,将所述主路径更新为所述第二主路径。3.根据权利要求2所述的方法,其特征在于,所述若所述第二主路径与所述主路径不匹配,将所述主路径更新为所述第二主路径包括:若所述第二主路径与所述主路径不匹配,利用所述第二主路径中的节点和边,构建新的主路径网络,并获取所述新的主路径网络的第三主路径;若所述第三主路径与所述第二主路径匹配,将所述主路径更新为所述第二主路径;若所述第三主路径与所述第二主路径不匹配,将所述第二主路径更新为所述第三主路径,利用更新后的所述第二主路径中的节点和边,再次构建新的主路径网络,并获取再次构建的主路径网络的第三主路径,直至再次构建的主路径网络的第三主路径与更新后的所述第二主路径匹配,将所述主路径更新为所述更新后的所述第二主路径。4.根据权利要求2所述的方法,其特征在于,所述利用所述主路径中的节点和边,构建主路径网络包括:在接收到用户触发了再次提取主路径的操作后,利用所述主路径中的节点和边,构建所述主路径网络;或者在所述主路径的路径参数满足预设主路径分析条件的情况下,利用所述主路径中的节点和边,构建所述主路径网络,其中所述路径参数包括所述过程节点在所述主路径中的占比、所述主路径中的节点数量和主路径总数中的至少一种参数。5.根据权利要求1至4中任意一项所述的方法,其特征在于,所述利用保存的所述特定节点的引用关系,在所述第一主路径中补充与所述第一主路径相关的引用关系,以得到所述引文网络的主路径包括:在所述特定节点包括所述源节点的情况下,利用所述源节点的引用关系,确定所述第一主路径中的起点所引用的所有源节点,基于所述所有源节点中各源节点的出度,选择添加至所述第一主路径中的源节点并恢复该源节点与所述第一主路径中的起点之间的边关系;和/或在所述特定节点包括所述汇节点的情况下...

【专利技术属性】
技术研发人员:张婷欧阳昭连
申请(专利权)人:中国医学科学院医学信息研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1