一种基于场景图演化的过程性文本理解方法和系统技术方案

技术编号：34256691 阅读：16 留言：0更新日期：2022-07-24 12:51

本发明专利技术公开了一种基于场景图演化的过程性文本理解方法和系统。该方法主要包含：图结构编码器充分建模当前场景图中不同实体、状态、位置和常识概念之间的交互信息；上下文编码器充分挖掘当前时刻自然语言中表达的新事件信息；图结构预测器通过图结构编码器提供的场景图信息和上下文编码器提供的新事件信息预测下一时刻的场景图结构；状态推理器基于图结构预测器自回归形式地预测出一系列时刻的场景图结构，通过对比相邻时刻的场景图结构和相应的专家知识同步追踪所有实体的状态和位置。本发明专利技术能够有效提升过程性文本理解任务的性能，并且基于图的推理方法能够同步追踪所有实体，显著提升了过程性文本理解系统的效率。显著提升了过程性文本理解系统的效率。显著提升了过程性文本理解系统的效率。

A process text understanding method and system based on scene graph evolution

全部详细技术资料下载

【技术实现步骤摘要】
一种基于场景图演化的过程性文本理解方法和系统

[0001]本专利技术涉及一种过程性文本理解方法，特别是涉及一种基于场景图演化的过程性文本理解方法和系统，属于自然语言处理

技术介绍

[0002]理解事件是如何影响世界是智能的一个本质问题。过程性文本理解任务，旨在追踪自然语言文本中涉及到的不同实体的状态和位置信息，是评估机器能否理解世界变化智能的一个代表性任务。如图1(a)所示，给定一段描述光合作用的自然语言文本，机器需要追踪其中涉及到的实体“water”随着自然语言描述的进行，他们的状态变化序列“Move,Move”和位置变化序列“root,leaf”。相较于传统的机器阅读理解任务，过程性文本理解面临更大的挑战：机器需要认知建模动态变化的世界并进行推理。
[0003]目前几乎所有的过程性文本理解方法均采用逐实体的建模和推理框架：它们分别地追踪不同的实体，独立地预测每个实体地状态变化序列和位置变化序列。如图1(a)所示，逐实体过程性文本理解方法大多依赖层次神经网络结构。给定一个段落和一个特定的待追踪实体：首先，层次神经网络结构通过一个词级别的编码器获得词级别的句子内交互表示；其次，层次神经网络通过一个句子级别的编码器获得句子级的文档内交互表示；最后，再通过两个不同的追踪器分别追踪实体状态和位置信息。近年来，研究者们的研究热点大多在于利用预训练语言模型或图结构的编码器获得更加精确的文档
‑
实体表示。
[0004]然而，传统的逐实体的过程性文本理解方法忽视了同一个自然语言文本中的不...

【技术保护点】

【技术特征摘要】
1.一种基于场景图演化的过程性文本理解方法，其特征在于，包括以下步骤：利用图结构编码器，通过图注意力网络，充分建模当前场景图中不同实体、状态、位置和常识概念之间的交互信息，以为场景图的演化提供丰富的当前场景图信息；利用上下文编码器，通过Transformer结构的预训练语言模型充分挖掘当前新的自然语言表述中存在的事件，尤其是对需要追踪的实体相关的事件，以为场景图的演化提供精确的新事件信息；基于图结构编码器提供的场景图信息和上下文编码器提供的新事件信息，利用图结构预测器预测下一时刻的场景图结构，包括场景图中存在的实体以及每个存在实体与位置、常识概念之间的关系；基于图结构预测器自回归形式地预测出一系列时刻的场景图结构，利用状态推理器通过对比相邻时刻的场景图结构和相应的专家知识同步追踪所有实体的状态和位置。2.如权利要求1所述的方法，其特征在于：利用过程性文本可以表示为一系列不同时刻的场景图和新时刻输入的自然语言描述的特点，分别通过所述图结构编码器和所述上下文编码器建模和捕捉对应信息，获得具有丰富交互信息的场景图信息和事件敏感的上下文信息。3.如权利要求1所述的方法，其特征在于：所述图结构预测器基于具有丰富交互信息的场景图信息和事件敏感的上下文信息预测下一时刻的场景图结构，并通过所述状态推理器同步追踪所有实体的状态和位置，有效提升过程性文本理解任务的性能，并显著提升过程性文本理解系统的效率。4.根据权利要求1所述的方法，其特征在于，所述图结构编码器采用以下步骤获得场景图：给定时刻t下的一系列图节点特征其中，M为场景图中所有概念的总数，图注意力网络利用自注意力机制计算两两节点之间的注意力得分：其中，为t时刻下节点i和节点j之间的关系向量表示，W1，W2和W3是三个可学习的参数；a表示注意力权重；随后，图注意力网络利用softmax计算方式归一化整个场景图中的注意力得分：其中，是t时刻下节点i的所有临接节点集合；得到整个场景图两两节点之间归一化后的注意力得分之后，通过如下公式更新节点表示：其中，σ表示激活函数；最终，使用最后一次更新中代表整个场景图的[Global]全局节点的向量表示作为时刻t的场景图表示：
其中，总结了当前场景图中不同实体、状态、位置和常识概念之间的交互信息；表示t时刻的场景图；GAT表示图注意力神经网络。5.根据权利要求1所述的方法，其特征在于，所述上下文编码器采用以下步骤挖掘当前新的自然语言表述中存在的事件：给定时刻t+1下的新自然语言文本，加入分隔符[CLS]和[SEP]以对其进...

【专利技术属性】
技术研发人员：孙乐，唐家龙，林鸿宇，陆垚杰，韩先培，郑佳，
申请(专利权)人：中国科学院软件研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人