信息获取的方法、装置、电子设备及存储介质制造方法及图纸

技术编号：38811845 阅读：16 留言：0更新日期：2023-09-15 19:50

本申请提供了一种信息获取的方法、装置、电子设备及存储介质，涉及人工智能领域。该信息获取的方法，包括：获取文本的文本向量表示；根据文本中的第一实体和第二实体在知识网络中的实体属性，确定第一实体的第一实体属性上下文向量和第二实体的第二实体属性上下文向量；确定第一实体与所述第二实体在知识网络中的三元组上下文向量；根据文本向量表示、第一实体属性上下文向量、第二实体属性上下文向量和三元组上下文向量，预测第一实体和第二实体在所述文本中的关系。利用知识网络中衍生的实体属性和三元组上下文作为外部特征，在文本的上下文的基础上结合外部特征进行关系抽取，能够有利于提高关系抽取任务的性能。够有利于提高关系抽取任务的性能。够有利于提高关系抽取任务的性能。

全部详细技术资料下载

【技术实现步骤摘要】
信息获取的方法、装置、电子设备及存储介质

[0001]本申请实施例涉及人工智能
，尤其涉及一种信息获取的方法、装置、电子设备及存储介质。

技术介绍

[0002]公开可用的大规模知识网络图在许多实际应用中广泛使用，如问答、事实检查、语音助手和搜索引擎等。尽管这些知识网络取得了成功和普及但他们并不完备。因此需要一些方法能够自动地从非结构化文本中提取知识到知识网络中。关系抽取是一种知识图谱补全任务，旨在确定两个给定实体之间的隐含关系，并将其对齐到背景知识网络。例如，给定句子“李白字太白，号青莲居士，唐代伟大的浪漫主义诗人，被后人誉为诗仙。他与杜甫合称
‘
李杜
’”
。关系抽取任务的目标是推断出语义关系，在这个例子中实体李白和杜甫是好友。可以看到背景知识的影响：正确的目标关系“好友”并没有在句子中明确的表达出来，但是模型就可以推断出正确的关系。
[0003]相关技术中，关系抽取方法主要依赖于远程学习范式。给定一个句子（或实例），多实体关系抽取考虑了给定实体对的所有先前出现情况，同时预测目标关系。然而在神经网络模型中只使用来自实体对的上下文信息会在训练数据中增加一些噪声，从而对整体预测效果产生负面影响。因此，如何提高关系抽取任务的性能亟待解决。

技术实现思路

[0004]本申请提供一种信息获取的方法、装置、电子设备及存储介质，能够有利于提高关系抽取任务的性能，提高关系抽取的质量。
[0005]第一方面，本申请实施例提供一种信息获取的方法，包括：获取文本的文...

【技术保护点】

【技术特征摘要】
1.一种信息获取的方法，其特征在于，包括：获取文本的文本向量表示；根据所述文本中的第一实体和第二实体在知识网络中的实体属性，确定所述第一实体的第一实体属性上下文向量和所述第二实体的第二实体属性上下文向量；确定所述第一实体与所述第二实体在所述知识网络中的三元组上下文向量，其中，所述三元组上下文向量包括第一实体向量、关系向量和第二实体向量；所述第一实体向量和所述关系向量之和等于所述第二实体向量；所述第一实体向量根据所述第一实体与所述知识网络中所述第一实体的邻域实体的三元组向量加权聚合得到；所述邻域实体包括所述第二实体；根据所述文本向量表示、所述第一实体属性上下文向量、所述第二实体属性上下文向量和所述三元组上下文向量，预测所述第一实体和所述第二实体在所述文本中的关系。2.根据权利要求1所述的信息获取的方法，其特征在于，所述确定所述第一实体与所述第二实体在所述知识网络中的三元组上下文向量，包括：获取初始三元组上下文向量，所述初始三元组上下文向量包括所述第一实体的初始实体向量、所述第二实体的初始实体向量和初始关系向量；所述初始关系向量表征所述第一实体和所述第二实体的初始关系；利用图注意力网络对所述初始三元组上下文向量加权聚合得到所述第一实体的邻域加权聚合向量；根据所述邻域加权聚合向量和所述初始三元组上下文向量，确定所述三元组上下文向量。3.根据权利要求2所述的信息获取的方法，其特征在于，所述利用图注意力网络对所述初始三元组上下文向量加权聚合得到所述第一实体的邻域加权聚合向量，包括：获取所述初始三元组上下文向量的注意力权重；对所述初始三元组上下文向量的权重进行归一化处理，得到所述初始化三元组上下文向量的相对注意力权重；根据所述相对注意力权重对所述初始三元组上下文向量进行加权聚合得到所述邻域加权聚合向量。4.根据权利要求2所述的信息获取的方法，其特征在于，所述根据所述邻域加权聚合向量和所述初始三元组上下文向量，确定所述三元组上下文向量，包括：根据所述邻域加权聚合向量和所述第一实体的初始实体向量，得到所述第一实体向量；对所述初始关系向量进行线性变换，得到所述关系向量；根据所述第二实体的初始实体向量和所述关系向量，得到所述第二实体向量；根据所述第一实体向量、所述关系向量和所述第二实体向量，得到所述三元组上下文向量。5.根据权利要求4所述的信息获取的方法，其特征在于，还包括：将所述第一实体向量经非线性变换由实体空间转换到关系空间；以及将所述第二实体向量经非线性变换由实体空间转换到关系空间。6.根据权利要求4所述的信息获取的方法，其特征在于，还包括：
根据所述第一实体与所述邻域实体对应的有效三元组确定第一距离度量，以及根据所述第一实体与所述邻域实体对应的无效三元组确定第二距离度量，其中，所述有效三元组包括所述第一实体与所述邻域实体之间的有效关系，所述无效三元组包括所述第一实体与所述邻域实体之间的无效关系；根据所述第一距离度量和所述第二距离度量，确定边际排序损失；最小化所述边际排序损失以对所述图注意力网络的参数进行更新。7.根据权利要求1所述的信息获取的方法，其特征在于，所述根据所述文本向量表示、所述第一实体属性上下文向量、所述第二实体属性上下文向量和所述三元组上下文向量，预测所述第一实体和所述第二实体在所述文本中的关系，包括：根据所述文本向量表示获取所述第一实体对应的第一文本向量表示，以及所述第二实体对应的第二文本向量表示；对所述第一文本向量表示和所述第一实体对应的单词的位置信息进行编码，得到第一编码向量，以及对所述第二文本向量表示和所述第二实体对应的单词的位置信息进行编码，得到第二编码向量；将所述第一编码向量、所述第一实体属性上下文向量输入传播模块，得到所述第一实体的分层表示向量；将所述第二编码向量、所述第二实体属性上下文向量输入所述传播模块，得到所述第二实体的分层表示向量；根据所述第一实体的分层表示向量和所述第二实体的分层表示向量得到所述第一实体和所述第二实体的连接关系；根据所述连接关系和所述三元组上下文向量，预测所述第一实体和所述第二...

【专利技术属性】
技术研发人员：石志林，
申请(专利权)人：深圳市腾讯计算机系统有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人