This application discloses a method and device for training relationships among entities of neural network, including: obtaining the relationship vector of single hop path and the path radial quantity of multi-hop path by using the relationship encoder; processing the path radial quantity of multi-hop path by using the path encoder to obtain the weighted representation of the multi-hop path; and using the feature extractor to obtain the relationship direction of the single hop path. The weighted representation of the quantities and the multi-hop paths is processed to obtain the shared features; the parameter updating of the feature extractor is based on the gradient generated by the source discriminator and the relational classifier; where the source discriminator is used to distinguish whether the input shared features come from the single-hop path or the multi-hop path; and the shared features are processed by the relational classifier to obtain the shared features. Describes the relationship training results between the first entity and the second entity.
【技术实现步骤摘要】
一种神经网络训练实体间关系的方法及装置
本申请涉及神经网络技术,尤其涉及一种神经网络训练实体间关系的方法及装置。
技术介绍
人工智能应用系统中,知识库(KnowledgeBase,KB)在很多场景中取得了显著效果和巨大成功,包括问答系统,信息检索和关系抽取。当前的大规模知识库包含客观世界的大量知识,经常通过三元组进行表示(“头实体”,关系,“尾实体”),如图1所示。然而,由于缺乏相关数据,当前的知识库的边(关系)过于稀疏。人工对其进行补全会耗费大量人力物力。因此,在已有的标注数据基础上发展知识库补全技术成为研究热点。根据特征选择和关系判定策略的差异,知识库补全技术可以被划分为以下几类:1)基于翻译模型的Trans系列方法将知识编码并嵌入一个连续的向量空间,并根据关系投影对模型进行学习。在此基础上,相关的关系评价/打分方法被提出,并进一步被用于补全给定实体间的关系。2)另一种前沿技术是基于路径排序算法(PathRanking,PR)的方法。它通过穷举并选择实体间的有价值的路径分析关系的特征。此类方法通过随机游走策略(RandomWalk,RW)来计算选定的路径和相关 ...
【技术保护点】
1.一种神经网络训练实体间关系的方法,其特征在于,所述方法包括:利用关系编码器对第一实体与第二实体间的单跳路径数据进行处理,得到所述单跳路径的关系向量,以及对第一实体与第二实体间的多跳路径中的各跳路径数据进行处理,得到所述多跳路径的路径向量;利用路径编码器对多个多跳路径的路径向量进行处理,得到所述多跳路径的加权表示;利用特征提取器对所述单跳路径的关系向量和所述多跳路径的加权表示进行处理,得到共享特征;所述特征提取器的参数更新依据源鉴别器和关系分类器产生的梯度;其中,所述源鉴别器用于判别输入的共享特征来自所述单跳路径还是所述多跳路径;利用所述关系分类器对所述共享特征进行处理, ...
【技术特征摘要】
1.一种神经网络训练实体间关系的方法,其特征在于,所述方法包括:利用关系编码器对第一实体与第二实体间的单跳路径数据进行处理,得到所述单跳路径的关系向量,以及对第一实体与第二实体间的多跳路径中的各跳路径数据进行处理,得到所述多跳路径的路径向量;利用路径编码器对多个多跳路径的路径向量进行处理,得到所述多跳路径的加权表示;利用特征提取器对所述单跳路径的关系向量和所述多跳路径的加权表示进行处理,得到共享特征;所述特征提取器的参数更新依据源鉴别器和关系分类器产生的梯度;其中,所述源鉴别器用于判别输入的共享特征来自所述单跳路径还是所述多跳路径;利用所述关系分类器对所述共享特征进行处理,得到所述第一实体和所述第二实体间的关系训练结果。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述特征提取器的参数更新的过程中,对所述源鉴别器和所述关系分类器产生的梯度进行联合训练。3.根据权利要求1所述的方法,其特征在于,所述利用关系编码器对第一实体与第二实体间的单跳路径数据进行处理,得到所述单跳路径的关系向量,包括:利用双向门控循环神经网络对所述单跳路径数据进行处理,得到所述单跳路径的关系向量。4.根据权利要求1所述的方法,其特征在于,所述利用关系编码器对第一实体与第二实体间的多跳路径中的各跳路径数据进行处理,得到所述多跳路径的路径向量,包括:利用双向门控循环神经网络对所述多跳路径中的各跳路径数据进行处理,得到所述各跳路径数据分别对应的关系向量;利用关系注意力层对所述各跳路径数据分别对应的关系向量进行处理,得到所述多跳路径的路径向量。5.根据权利要求1至4任一项所述的方法,其特征在于,所述路径编码器包括路径注意力层。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:所述源鉴别器利用交叉熵函数判别输入的共享特征来自所述单跳路径...
【专利技术属性】
技术研发人员:李建欣,李晨,彭煦潭,彭浩,张日崇,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。