关系信息抽取方法、设备及计算机可读存储介质技术

技术编号：36294782 阅读：15 留言：0更新日期：2023-01-13 10:08

本申请提供一种关系信息抽取方法、设备及计算机可读存储介质。该方法包括：获取当前应用领域的文本语料，文本语料包含至少一个句子文本；将句子文本输入关系信息抽取模型，通过关系信息抽取模型抽取句子文本包含的超关系事实，超关系事实包括关系三元组和关系三元组的限定信息。本申请的方法，利用端到端的关系信息抽取模型，将文本语料中的句子文本输入关系信息抽取模型，该关系信息抽取模型抽取并输出句子文本包含的超关系事实，实现了以端到端的方式执行超关系事实的抽取，避免了两阶段方法的错误传播问题，能够抽取到更多有效的超关系事实，提高了模型的召回率和性能。提高了模型的召回率和性能。提高了模型的召回率和性能。

全部详细技术资料下载

【技术实现步骤摘要】
关系信息抽取方法、设备及计算机可读存储介质

[0001]本申请涉及计算机技术，尤其涉及一种关系信息抽取方法、设备及计算机可读存储介质。

技术介绍

[0002]知识图谱(Knowledge Graph)是人工智能中的基础数据结构，可广泛应用于搜索引擎、社交网络和电子商务等领域。通常知识图谱中包含由头实体、关系类别和尾实体构成的关系三元组的信息。例如关系三元组(张三，受教育于，A大学)。在实际应用场景中通常还存在对关系三元组的限定信息，如(张三，受教育于，A大学)可以有时间结束于1967年、取得博士学位等限定信息。将关系三元组与其限定信息形成一个超关系事实(Hyper
‑
Relational Fact)，超关系事实可以更好地代表丰富而复杂的知识图谱结构。
[0003]关系抽取(Relation Extraction，简称RE)是从文本中提取未知关系事实的方式，是自动构建大规模知识图谱的关键环节。传统的关系抽取模型用于抽取关系三元组，并不关注关系三元组的限定信息。为了抽取超关系事实，目前采用两阶段的关系抽取方法，第一阶段利用传统关系抽取模型从句子文本中抽取关系三元组，第二阶段在根据句子文本和关系三元组抽取限定信息。
[0004]然而，两阶段的关系抽取方法容易产生错误传播，导致抽取到的超关系事实的数量减少。

技术实现思路

[0005]本申请提供一种关系信息抽取方法、设备及计算机可读存储介质，用以解决现有的两阶段的关系抽取方法容易产生错误传播，导致抽取到的超关系事实的数量减少的...

【技术保护点】

【技术特征摘要】
1.一种关系信息抽取方法，其特征在于，包括：获取当前应用领域的文本语料，所述文本语料包含至少一个句子文本；将所述句子文本输入关系信息抽取模型，通过所述关系信息抽取模型抽取句子文本包含的超关系事实，所述超关系事实包括关系三元组和所述关系三元组的限定信息。2.根据权利要求1所述的方法，其特征在于，所述限定信息包含限定类别和限定值实体，所述超关系事实表示为由头实体、关系类别、尾实体、限定类别和限定值实体组成的五元组。3.根据权利要求1或2所述的方法，其特征在于，还包括：根据所述超关系事实的关系三元组和关系三元组的限定信息，构建或更新超关系知识图谱，所述超关系知识图谱包含超关系事实。4.根据权利要求2所述的方法，其特征在于，所述将所述句子文本输入关系信息抽取模型，通过所述关系信息抽取模型抽取句子文本包含的超关系事实，包括：将句子文本输入关系信息抽取模型，通过所述关系信息抽取模型进行如下处理：对句子文本中的每个字进行编码，生成所述句子文本中每个字的上下文化表示；根据所述句子文本中每个字的上下文化表示，将每个字作为备选头实体和备选尾实体，确定任意备选头实体和任意备选尾实体形成的备选实体对的关系类别概率信息；将所述句子文本中的字作为备选限定值实体，根据任意备选实体对的实体对表示和任意备选限定值实体的上下文化表示，确定任意备选限定值实体与任意的备选实体对构成的备选事实的限定类别概率信息，所述备选事实为超关系事实的备选；根据所述备选实体对的关系类别概率信息和任意备选限定值实体与任意的备选实体对构成的备选事实的限定类别概率信息，解码出句子文本包含的超关系事实。5.根据权利要求4所述的方法，其特征在于，所述根据所述句子文本中每个字的上下文化表示，将每个字作为备选头实体和备选尾实体，确定任意备选头实体和任意备选尾实体形成的备选实体对的关系类别概率信息，包括：根据所述句子文本中每个字的上下文化表示，将每个字作为备选头实体和备选尾实体，将任意备选头实体和任意备选尾实体的上下文化表示连接后输入第一前馈神经网络，得到所述任意备选头实体和任意备选尾实体形成的备选实体对的实体对表示；将所述备选实体对的实体对表示经过第二前馈神经网络和softmax层的处理，得到所述备选实体对对应于任意关系类别的概率。6.根据权利要求4所述的方法，其特征在于，所述将所述句子文本中的字作为备选限定值实体，根据任意备选实体对的实体对表示和任意备选限定值实体的上下文化表示，确定任意备选限定值实体与任意的备选实体对构成的备选事实的限定类别概率信息之前，还包括：将备选头实体和备选尾实体为句子文本中同一个字的备选实体对作为目标实体对，将目标实体对对应于任意关系类别的概率中的最大值，作为该字的实体概率，得到句子文本中每个字的实体概率；对句子文本中每一个字的实体概率进行排序，并根据排序结果确定预设数量的字作为参考实体，将参考实体作为备选限定值实体；根据参考实体对备选实体对进行筛选，去除包含除参考实体外的其他字的备选实体
对，保留备选头实体和备选尾实体均为参考实体的备选实体对。7.根据权利要求4或6所述的方法，其特征在于，所述根据任意备选实体对的实体对表示和任意备选限定值实体的上下文化表示，确定任意备选限定值实体与任意的备选实体对构成的备选事实的限定类别概率信息，包括：将任意备选实体对的实体对表示的转置和任意备选限定值实体的上下文化表示，经过双线性交互层和softmax层的处理，得到任意备选限定值实体与任意的备选实体对构成的备选事实对应于任意限定类别的概率。8.根据权利要求4
‑
6中任一项所述的方法，其特征在于，所述根据所述备选实体对的关系类别概率信息和任意备选限定值实体...

【专利技术属性】
技术研发人员：谢耀赓，邴立东，赛赞亚，
申请(专利权)人：新加坡科技设计大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人