一种基于层次图神经网络的表格文本问答方法技术

技术编号：34767462 阅读：21 留言：0更新日期：2022-08-31 19:21

本发明专利技术公开了一种基于层次图神经网络的表格文本问答方法，该方法首先通过稀疏检索器快速召回与问题关联的文本证据信息，并将这些证据信息填充到表格中；接着利用表格行选择模型对表格行打分排序，从而找到最有可能包含答案的答案行；然后对答案行以及关联文本融合编码得到特征向量表示，进而使用基于表格行的层次图神经网络对问题、单元格、短文进行图推理，以捕捉表格特有的半结构化信息；最后，通过三个相互关联的子任务求解得到问题对应的答案。本发明专利技术能够有效地解决表格和文本相互补充场景下的多跳问答问题。景下的多跳问答问题。景下的多跳问答问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于层次图神经网络的表格文本问答方法

[0001]本专利技术涉及一种基于层次图神经网络的表格文本问答方法，属于互联网和人工智能

技术介绍

[0002]随着大数据、网络工程、通讯工程等相关技术的不断发展与进步，信息的传播变得越来越容易，从而导致网络上各种繁杂信息量呈指数性增长。据统计，互联网上的大部分信息以文本的形式存在，但也有较多信息被存放在半结构化的表格中，表格相比非架构化的文本具有更加严谨的信息聚合性，但是表格中的每个单元格的信息量往往较少，通常表现一个短语或者一个数值。如果能够将表格信息和文本信息相结合，就能在丰富信息量的同时，又能较好地保持结构化特征。例如在维基百科上表格中的单元格，大多数都会与相关的百科实体进行链接，作为对表格信息的补充。如何利用自然语言处理技术对表格文本混合信息进行机器阅读理解，是一个十分具有应用价值的难题。
[0003]目前，传统的机器阅读理解的任务主要分为：完形填空、多项选择、常识问答和片段抽取。其中片段抽取是指从给定的预料范围内，通过推理分析，抽取处材料中的文本片段作为答案。片段抽取任务最典型的应用就是问答系统，问答系统允许人们提出符合自然语言形式的问题，然后经过深入的问题分析和知识推理之后，直接返回答案，问答系统能够帮助用户快速从语料库从聚焦关键信息，显著地提高了人们处理信息的效率。由于减少了用户的处理时间，而且便于语音交互，问答系统目前在智能客服、智能检索、IOT智能家居领域等领域获得了广泛应用。尽管越来越多的问答相关算法和系统被提出，但该领域仍有许多挑战需...

【技术保护点】

【技术特征摘要】
1.一种基于层次图神经网络的表格文本问答方法，其特征在于，包括如下步骤：(1)关键信息检索：使用一个稀疏检索检索器和一个最长子串匹配器在表格和短文中寻找与答案最可能相关的支持证据标记为SE(Support Evidence)，检索器会计算单元格以及短文句子与问题之间的相似度，同时会选择相似度小于0.8的相关证据信息进行标记；(2)表格行选择：使用TaPas作为表格编码模型，将包含SE信息的表格行用TaPas进行预编码，然后将所有检索到的SE信息填充到table中来得到整张表的向量表示，通过一个表格行选择器；(3)长文本编码：使用一个长编码模型来对表格行以及该表格行的外链文本进行编码，以此来获取输入的特征向量表示；(4)层次图推理：本发明设计并构建一种名为row
‑
HGN的层次图神经网络模型，用row
‑
HGN对三种类型的节点(问题，单元格，短文)进行建模，然后在三种节点之间做图推理，以捕捉半结构化信息；(5)多任务答案抽取：一种混合的损失作为模型反向传播的函数，通过单元格选择，答案定位选择以及答案位置定位三个子任务来最终定位答案。2.根据权利要求1所述的基于层次图神经网络的表格文本问答方法，其特征在于，所述TF
‑
IDF检索器会选择相似度小于0.8的相关证据信息标记为SE，并且填充到表格中。3.根据权利要求1所述的基于层次图神经网络的表格文本问答方法，其特征在于，步骤(2)中表格行选择模型只会选取包含SE信息的表格行进行排序，过程如下：Row
i
＝MLP(Pooling(TR[start
i
∶end
i
]))start
i
和end
i
表示每行的开始位置和结束位置，然后将Row
i
的向量矩阵送到两层MLP构成的classifier中，根据每一行的logits大小选择答案最可能存在的那一行，其中MLP是多层感知器，Pooling表示池化层，选取概率最大的表格行作为答案行，计算如下：其中，softmax是逻辑回归函数，max是最大值函数。4.根据权利要求1所述的基于层次图神经网络的表格文本问答方法，其特征在于，步骤(3)所述长文本编码会将表格行数据转换成自然语言形式的句子，按问题、单元格、短文的顺序拼接起来，然后将不同的节点以边的形式连接起来，以捕捉结构信息；E＝LongFormer(Q,C,P)其中，Q，C，P分别表示问题、单元格和短文输入，LongFormer()表示使用Longformer模型进行长文本编码。5.根据权利要求1所述的基于层次图神经网络的表格文本问答方法...

【专利技术属性】
技术研发人员：杨鹏，李文军，汤亚玲，陈维威，
申请(专利权)人：东南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人