一种基于图卷积的视觉问答增强方法技术

技术编号：22444538 阅读：30 留言：0更新日期：2019-11-02 04:28

本发明专利技术公开了一种基于图卷积的视觉问答增强方法。本发明专利技术包括以下步骤：步骤1、分别提取图片和问题的特征表示；步骤2、提取基于问题生成的图片中各目标之间的关系；步骤3、将带有问题信息的图片生成为graph，并且为每个顶点挑选最相关的目标，为每个顶点生成新的特征表示之后，对graph进行最大池化和分类。本发明专利技术利用GCN网络和图片中物体之间的关系来探索高层次语义，对视觉问答技术有较大意义。

An enhancement method of visual Question Answering Based on graph convolution

全部详细技术资料下载

【技术实现步骤摘要】
一种基于图卷积的视觉问答增强方法
本专利技术属于计算机视觉、自然语言
，特别地，本专利技术涉及一种基于图卷积的视觉问答增强方法。技术背景视觉问答(VQA)是近年来备受关注的新兴话题。它结合了计算机视觉和自然语言处理(NLP)这两个领域，并要求我们在这两个领域都有很好的理解。VQA系统将图像和自由形式的自然语言问题作为输入，并生成自然语言答案作为输出。大多数VQA方法将任务视为分类任务，并分别提取图像和问题特征。之后，他们探索了从深度卷积神经网络(CNNs)学习的图像表示的多模态特征融合以及从时间序列模型(如长期短期记忆(LSTM)和门控递归神经网络(GRU)中获得的问题表示。)网络)以捕获多模态特征之间的相互作用。这些融合模型使用双线性池化和基于注意力的方式等。然而，这些方法并不真正理解得到答案的推理过程，而没有选择与图片中的异议最相关的目标，使得信息变得非常多余的。卷积神经网络(CNNs)已经在计算机视觉和自然语言处理等领域取得了最新水平，能够处理欧几里德数据结构并有效地探索特征表示。欧几里德数据是指数据然而，在现实世界中存在大量的非欧几里德数据，例如社交多媒体网络数据，化学复合结构数据和知识图数据等。诸如CNN之类的神经网络结构不能有效地处理这种图形结构。由ThomasKpif提出的Data.Graph卷积神经网络(GCN)可以在同一时间执行节点特征信息和结构信息的端到端学习，旨在将CNN应用于图域。空间GCN是一种更直观的方式，只需要在拓扑图上提取空间特征，然后找到与每个顶点相邻的邻居在基于问题的图像物体之间的关系能让图像有一个更好的语义解...

【技术保护点】
1.一种基于图卷积的视觉问答增强方法，其特征在于包括以下步骤：步骤1、分别提取图片和问题的特征表示；步骤2、提取基于问题生成的图片中各目标之间的关系，构建关系特征检测器；步骤3、将带有问题信息的图片生成为graph，并且为每个顶点挑选最相关的目标，为每个顶点生成新的特征表示之后，对graph进行最大池化和分类。

【技术特征摘要】
1.一种基于图卷积的视觉问答增强方法，其特征在于包括以下步骤：步骤1、分别提取图片和问题的特征表示；步骤2、提取基于问题生成的图片中各目标之间的关系，构建关系特征检测器；步骤3、将带有问题信息的图片生成为graph，并且为每个顶点挑选最相关的目标，为每个顶点生成新的特征表示之后，对graph进行最大池化和分类。2.根据权利要求1所述的一种基于图卷积的视觉问答增强方法，其特征在于步骤2所述的构建关系特征检测器，具体如下：首先将带有resnet101的faster-rcnn在框架中被用作对象检测器；其次采用模型的输出并应用NMS操作并按IOU阈值选择32个对象；最后通过平均池层，将特征中的提议集成到2048个维度；对象特征vi是在faster-rcnn中从RPN中生成，其中i＝0,1,2，...，k-1，为了学习单实例属性以及原始检测操作，设置属性分类器来学习实例属性；因此单个的属性学习概况如下：其中W*和b*是可学习的参数，*是连接操作；LOCi，CLSi和ATTi是第i个物体的边界框、类和属性预测；学习关系数据能够直接显示关系标签的质量和关系数据在语义任务中的力量；因此通过以下等式实现实体之间的关系：Ni＝W1vi+b1公式4Ri，j＝W2(Ni+Nj)+b2公式5其中，W1、W2、b1、b2是用于将实例映射到关系域的可学习参数，Ni是用于将单个的实例特征映射到关系域的节点，Ri，j是提议实例的关系预测i和j；在关系训练中，提出的特征首先由全连接层映射到关系空间；然后，融合映射的功能以获得提出的特征之间的关系标签；设作品中有k个特征，所有k*(k-1)个关系组合都参与训练；实际标签由锚点设置和检测ROI分配；目标标签是VrR-VG数据集中的所有关系以及一个附加的无关系的标...

【专利技术属性】
技术研发人员：颜成钢，俞灵慧，孙垚棋，张继勇，张勇东，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人