信息获取的方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38811845 阅读:16 留言:0更新日期:2023-09-15 19:50
本申请提供了一种信息获取的方法、装置、电子设备及存储介质,涉及人工智能领域。该信息获取的方法,包括:获取文本的文本向量表示;根据文本中的第一实体和第二实体在知识网络中的实体属性,确定第一实体的第一实体属性上下文向量和第二实体的第二实体属性上下文向量;确定第一实体与所述第二实体在知识网络中的三元组上下文向量;根据文本向量表示、第一实体属性上下文向量、第二实体属性上下文向量和三元组上下文向量,预测第一实体和第二实体在所述文本中的关系。利用知识网络中衍生的实体属性和三元组上下文作为外部特征,在文本的上下文的基础上结合外部特征进行关系抽取,能够有利于提高关系抽取任务的性能。够有利于提高关系抽取任务的性能。够有利于提高关系抽取任务的性能。

【技术实现步骤摘要】
信息获取的方法、装置、电子设备及存储介质


[0001]本申请实施例涉及人工智能
,尤其涉及一种信息获取的方法、装置、电子设备及存储介质。

技术介绍

[0002]公开可用的大规模知识网络图在许多实际应用中广泛使用,如问答、事实检查、语音助手和搜索引擎等。尽管这些知识网络取得了成功和普及但他们并不完备。因此需要一些方法能够自动地从非结构化文本中提取知识到知识网络中。关系抽取是一种知识图谱补全任务,旨在确定两个给定实体之间的隐含关系,并将其对齐到背景知识网络。例如,给定句子“李白字太白,号青莲居士,唐代伟大的浪漫主义诗人,被后人誉为诗仙。他与杜甫合称

李杜
’”
。关系抽取任务的目标是推断出语义关系,在这个例子中实体李白和杜甫是好友。可以看到背景知识的影响:正确的目标关系“好友”并没有在句子中明确的表达出来,但是模型就可以推断出正确的关系。
[0003]相关技术中,关系抽取方法主要依赖于远程学习范式。给定一个句子(或实例),多实体关系抽取考虑了给定实体对的所有先前出现情况,同时预测目标关系。然而在神经网络模型中只使用来自实体对的上下文信息会在训练数据中增加一些噪声,从而对整体预测效果产生负面影响。因此,如何提高关系抽取任务的性能亟待解决。

技术实现思路

[0004]本申请提供一种信息获取的方法、装置、电子设备及存储介质,能够有利于提高关系抽取任务的性能,提高关系抽取的质量。
[0005]第一方面,本申请实施例提供一种信息获取的方法,包括:获取文本的文本向量表示;根据所述文本中的第一实体和第二实体在知识网络中的实体属性,确定所述第一实体的第一实体属性上下文向量和所述第二实体的第二实体属性上下文向量;确定所述第一实体与所述第二实体在所述知识网络中的三元组上下文向量,其中,所述三元组上下文向量包括第一实体向量、关系向量和第二实体向量;所述第一实体向量和所述关系向量之和等于所述第二实体向量;所述第一实体向量根据所述第一实体与所述知识网络中所述第一实体的邻域实体的三元组向量加权聚合得到;所述邻域实体包括所述第二实体;根据所述文本向量表示、所述第一实体属性上下文向量、所述第二实体属性上下文向量和所述三元组上下文向量,预测所述第一实体和所述第二实体在所述文本中的关系。
[0006]第二方面,本申请实施例提供一种信息获取的装置,其特征在于,包括:获取单元,用于获取文本的文本向量表示;第一确定单元,用于根据所述文本中的第一实体和第二实体在知识网络中的实体
属性,确定所述第一实体的第一实体属性上下文向量和所述第二实体的第二实体属性上下文向量;第二确定单元,用于确定所述第一实体与所述第二实体在所述知识网络中的三元组上下文向量,其中,所述三元组上下文向量包括第一实体向量、关系向量和第二实体向量;所述第一实体向量和所述关系向量之和等于所述第二实体向量;所述第一实体向量根据所述第一实体与所述知识网络中所述第一实体的邻域实体的三元组向量加权聚合得到;所述邻域实体包括所述第二实体;预测单元,用于根据所述文本向量表示、所述第一实体属性上下文向量、所述第二实体属性上下文向量和所述三元组上下文向量,预测所述第一实体和所述第二实体在所述文本中的关系。
[0007]第三方面,本申请实施例提供一种电子设备,包括:处理器和存储器,该存储器用于存储计算机程序,该处理器用于调用并运行该存储器中存储的计算机程序,执行如第一方面中的方法。
[0008]第四方面,本申请实施例提供一种计算机可读存储介质,包括指令,当其在计算机上运行时使得计算机执行如第一方面中的方法。
[0009]第五方面,本申请实施例提供一种计算机程序产品,包括计算机程序指令,该计算机程序指令使得计算机执行如第一方面中的方法。
[0010]第六方面,本申请实施例提供一种计算机程序,计算机程序使得计算机执行如第一方面中的方法。
[0011]通过上述技术方案,本申请实施例利用知识网络中衍生的实体属性和三元组上下文作为外部特征,在文本的上下文的基础上结合外部特征进行关系抽取,通过使用来自知识网络的知识补充从文本中得到的上下文,减轻来自先前文本的噪声对整体关系抽取性能的影响,能够有利于提高关系抽取任务的性能,提高关系抽取的质量。
附图说明
[0012]图1为本申请实施例的方案的应用场景的一个示意图;图2为根据本申请实施例的系统架构的一个示意图;图3为根据本申请实施例的一种信息获取的方法的示意性流程图;图4为获取给定实体的实体属性上下文向量的过程一个示意图;图5为根据本申请实施例的另一种信息获取的方法的示意性流程图;图6为根据本申请实施例的另一种信息获取的方法的示意性流程图;图7为根据本申请实施例的一种信息获取的装置的示意性框图;图8为根据本申请实施例的电子设备的示意性框图。
具体实施方式
[0013]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。
[0014]应理解,在本申请实施例中,“与A对应的B”表示B与A相关联。在一种实现方式中,可以根据A确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或
其它信息确定B。
[0015]在本申请的描述中,除非另有说明,“至少一个”是指一个或多个,“多个”是指两个或多于两个。另外,“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a, b, c, a

b, a

c, b

c, 或a

b

c,其中a,b,c可以是单个,也可以是多个。
[0016]还应理解,本申请实施例中出现的第一、第二等描述,仅作示意与区分描述对象之用,没有次序之分,也不表示本申请实施例中对设备个数的特别限定,不能构成对本申请实施例的任何限制。
[0017]还应理解,说明书中与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。
[0018]此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0019]本申请实施例应用于人工智能

[0020]其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息获取的方法,其特征在于,包括:获取文本的文本向量表示;根据所述文本中的第一实体和第二实体在知识网络中的实体属性,确定所述第一实体的第一实体属性上下文向量和所述第二实体的第二实体属性上下文向量;确定所述第一实体与所述第二实体在所述知识网络中的三元组上下文向量,其中,所述三元组上下文向量包括第一实体向量、关系向量和第二实体向量;所述第一实体向量和所述关系向量之和等于所述第二实体向量;所述第一实体向量根据所述第一实体与所述知识网络中所述第一实体的邻域实体的三元组向量加权聚合得到;所述邻域实体包括所述第二实体;根据所述文本向量表示、所述第一实体属性上下文向量、所述第二实体属性上下文向量和所述三元组上下文向量,预测所述第一实体和所述第二实体在所述文本中的关系。2.根据权利要求1所述的信息获取的方法,其特征在于,所述确定所述第一实体与所述第二实体在所述知识网络中的三元组上下文向量,包括:获取初始三元组上下文向量,所述初始三元组上下文向量包括所述第一实体的初始实体向量、所述第二实体的初始实体向量和初始关系向量;所述初始关系向量表征所述第一实体和所述第二实体的初始关系;利用图注意力网络对所述初始三元组上下文向量加权聚合得到所述第一实体的邻域加权聚合向量;根据所述邻域加权聚合向量和所述初始三元组上下文向量,确定所述三元组上下文向量。3.根据权利要求2所述的信息获取的方法,其特征在于,所述利用图注意力网络对所述初始三元组上下文向量加权聚合得到所述第一实体的邻域加权聚合向量,包括:获取所述初始三元组上下文向量的注意力权重;对所述初始三元组上下文向量的权重进行归一化处理,得到所述初始化三元组上下文向量的相对注意力权重;根据所述相对注意力权重对所述初始三元组上下文向量进行加权聚合得到所述邻域加权聚合向量。4.根据权利要求2所述的信息获取的方法,其特征在于,所述根据所述邻域加权聚合向量和所述初始三元组上下文向量,确定所述三元组上下文向量,包括:根据所述邻域加权聚合向量和所述第一实体的初始实体向量,得到所述第一实体向量;对所述初始关系向量进行线性变换,得到所述关系向量;根据所述第二实体的初始实体向量和所述关系向量,得到所述第二实体向量;根据所述第一实体向量、所述关系向量和所述第二实体向量,得到所述三元组上下文向量。5.根据权利要求4所述的信息获取的方法,其特征在于,还包括:将所述第一实体向量经非线性变换由实体空间转换到关系空间;以及将所述第二实体向量经非线性变换由实体空间转换到关系空间。6.根据权利要求4所述的信息获取的方法,其特征在于,还包括:
根据所述第一实体与所述邻域实体对应的有效三元组确定第一距离度量,以及根据所述第一实体与所述邻域实体对应的无效三元组确定第二距离度量,其中,所述有效三元组包括所述第一实体与所述邻域实体之间的有效关系,所述无效三元组包括所述第一实体与所述邻域实体之间的无效关系;根据所述第一距离度量和所述第二距离度量,确定边际排序损失;最小化所述边际排序损失以对所述图注意力网络的参数进行更新。7.根据权利要求1所述的信息获取的方法,其特征在于,所述根据所述文本向量表示、所述第一实体属性上下文向量、所述第二实体属性上下文向量和所述三元组上下文向量,预测所述第一实体和所述第二实体在所述文本中的关系,包括:根据所述文本向量表示获取所述第一实体对应的第一文本向量表示,以及所述第二实体对应的第二文本向量表示;对所述第一文本向量表示和所述第一实体对应的单词的位置信息进行编码,得到第一编码向量,以及对所述第二文本向量表示和所述第二实体对应的单词的位置信息进行编码,得到第二编码向量;将所述第一编码向量、所述第一实体属性上下文向量输入传播模块,得到所述第一实体的分层表示向量;将所述第二编码向量、所述第二实体属性上下文向量输入所述传播模块,得到所述第二实体的分层表示向量;根据所述第一实体的分层表示向量和所述第二实体的分层表示向量得到所述第一实体和所述第二实体的连接关系;根据所述连接关系和所述三元组上下文向量,预测所述第一实体和所述第二...

【专利技术属性】
技术研发人员:石志林
申请(专利权)人:深圳市腾讯计算机系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1