一种自动搜索时序知识图谱补全模型的方法技术

技术编号:35746002 阅读:25 留言:0更新日期:2022-11-26 18:50
本发明专利技术涉及人工智能领域中的时序知识图谱的补全技术,公开了一种自动搜索时序知识图谱补全模型的方法,包括:步骤1:将待补全的时序知识图谱按照不同时间戳划分为若干个静态知识图谱切片;步骤2:定义搜索空间,基于定义好的搜索空间构建超网络;步骤3:使用单路径采样策略优化超网络的参数;步骤4:对超网络进行一次架构采样,并使架构继承超网络的对应参数,利用架构在验证集上进行推理,得到验证性能;步骤5:实施若干次步骤4,得到对应验证性能最优的架构。本发明专利技术方法在三个公开的基准数据集上,可以搜索出比手工设计模型补全性能更优的网络模型;可以针对不同的数据集搜索出不同的网络结构,提升了模型结构的灵活性与数据适应性。应性。应性。

【技术实现步骤摘要】
一种自动搜索时序知识图谱补全模型的方法


[0001]本专利技术涉及人工智能领域中的时序知识图谱的补全技术,具体涉及一种自动搜索时序知识图谱补全模型的方法。

技术介绍

[0002]近年来,时序知识图谱因其对现实世界的合理建模而受到研究者的广泛关注,时序知识图谱是富含许多时间敏感的关系事实的图结构数据,如图1所示。其中人物A、人物B、国别是图中的节点,节点之间的关系是图中的边。
[0003]时序知识图谱将知识描述为(头实体,关系,尾实体,时间戳) 的四元组形式,如(人物A,当选某职位,国别,2016年11月X日), (人物A,公开指责,人物B,2022年4月X日)等。时间戳信息可以帮助确定知识成立的时间,使得知识图谱中的知识事实更加可信,这也促进了时序知识图谱在问答系统、推荐系统等领域的一系列应用研究。但绝大多数时序知识图谱都存在着不完整的问题,存在着大量的知识缺失,这会严重影响其应用在下游任务中的性能。为了补全其内部缺失的知识,时序知识图谱补全任务由此产生,时序知识图谱补全任务是时序知识图谱领域的基础问题,旨在预测图谱中的缺失知识。...

【技术保护点】

【技术特征摘要】
1.一种自动搜索时序知识图谱补全模型的方法,其特征在于,包括以下步骤:步骤1:将待补全的时序知识图谱按照不同时间戳划分为若干个静态知识图谱切片;步骤2:定义搜索空间,基于定义好的搜索空间构建超网络;步骤3:使用单路径采样策略优化超网络的参数,得到训练好的超网络;步骤4:对超网络进行一次架构采样,并使所述架构继承超网络的对应参数,利用所述架构在验证集上进行推理,得到验证性能;步骤5:实施若干次步骤4,得到对应验证性能最优的架构,将此架构作为搜索出的对应该时序知识图谱的最优网络结构,用于时序知识图谱补全任务。2.根据权利要求1所述的自动搜索时序知识图谱补全模型的方法,其特征在于,步骤1中,针对数据集,构造一个实体词典,一个关系词典和一个时间戳词典,使用给定的数字ID表示数据集中的四元组,即头实体,关系,尾实体和时间戳。3.根据权利要求2所述的自动搜索时序知识图谱补全模型的方法,其特征在于,将数据集划分为训练集、验证集和测试集,再按照不同的表示时间戳的数字ID将训练集、验证集和测试集中的四元组均划分成n个集合,得到n个静态知识图谱切片。4.根据权利要求1所述的自动搜索时序知识图谱补全模型的方法,其特征在于,步骤2中,对于神经网络结构搜索,首先定义一个搜索空间,搜索空间包括4个部分:拓扑结构编码器、时序信息编码器、层间连接模块和层间聚合模块,其中拓扑结构编码器的候选操作包括:RGCN基于多关系的图卷积网络、RGAT基于多关系注意力的图卷积网络和COMPGCN基于组合操作的多关系图卷积网络,所述时序信息编码器的候选操作包括:GRU门控循环单元、SELF

ATTENTION自注意力机制和IDENTITY将输入值作为输出值的运算;所述层间连接模块的候选操作包括:LC_CONCAT对向量进行合并的运算、LC_SUM求和的运算和LC_SKIP不采取层间连接的运算;所述层间聚合模块的候选操作包括:LF_CONCAT将输入值作为输出值的运算、LF_MAX求最大值的运算、LF_MEAN求平均值的运算和LF_SKIP不采取层间融合的运算。5.根据权...

【专利技术属性】
技术研发人员:王震杜昊桐高超刘晨李学龙
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1