一种提取整合图像内部与图像之间特征关系的方法和装置制造方法及图纸

技术编号：35441564 阅读：17 留言：0更新日期：2022-11-03 11:52

本发明专利技术公开了一种提取整合图像内部与图像之间特征关系的方法及装置。该方法包括如下步骤：使用内部关系网络表征图像内部的特征关系，使用交叉关系网络表征图像之间的特征关系；其中，将内部关系网络划分为空间关系模块和通道关系模块；将图像序列分别输入空间关系模块、通道关系模块和交叉关系网络；在空间关系模块、通道关系模块和交叉关系网络中，图像序列依次经过压缩层、基于注意力的关系模块层和恢复层的处理之后，进入批量规范化层以加速卷积神经网络的收敛速度；使用卷积融合函数，将空间关系模块、通道关系模块和交叉关系网络的输出融合在一起，作为输出结果。利用本发明专利技术，可以增强卷积神经网络在抽象视觉推理任务中的推理能力。的推理能力。的推理能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种提取整合图像内部与图像之间特征关系的方法和装置

[0001]本专利技术涉及一种提取整合图像内部与图像之间特征关系的方法，同时也涉及采用该方法的装置，属于计算机视觉

技术介绍

[0002]近年来，抽象视觉推理作为人类智能的关键组成部分，在计算机视觉
中得到了广泛的研究。目前，一个非常有效的人类视觉推理能力测试已经开发出来，被称为瑞文测试(Raven Progressive Matrices，简写为RPM)。瑞文测试直接位于人类智能中心，是对抽象和结构推理能力的判断，并且描述了高级智能的定义特征，即流体智能。为了突破当前视觉推理能力的极限，UCLA的朱松纯团队还基于瑞文测试构建了关系和类比视觉推理数据集RAVEN。
[0003]随着各种卷积神经网络(CNN)的出现，人们试图测量机器的横向思维和流体智能。卷积神经网络的最新进展显示了抽象视觉推理的优良性能。为了发展机器的抽象化视觉感知能力，有两个基础问题需要解决：一是图像的识别表示，二是图像内部规律的发现。尽管现有的关系网络(Relation Networks，简写为RN)建模方法已经显著提高了抽象视觉推理的性能，但是当前的关系网络建模仅关注于各种图像的外部交叉关系。由于缺乏内部关系建模，神经网络无法准确地提取图像特征表示。同时，基于关系网络的建模方法仅考虑了任意两个图像的简单线性关系，而忽略了高阶非线性关系。作为一种潜在的解决方案，图神经网络(GNN)的特点在于可以有效建模非欧几里得数据结构的关系。此外，神经网络在非线性关系建模方面的出色表现，...

【技术保护点】

【技术特征摘要】
1.一种提取整合图像内部与图像之间特征关系的方法，其特征在于包括如下步骤：使用内部关系网络表征图像内部的特征关系，使用交叉关系网络表征图像之间的特征关系；其中，将所述内部关系网络划分为空间关系模块和通道关系模块；将图像序列分别输入所述空间关系模块、所述通道关系模块和所述交叉关系网络；在所述空间关系模块、所述通道关系模块和所述交叉关系网络中，所述图像序列依次经过压缩层、基于注意力的关系模块层和恢复层的处理之后，进入批量规范化层以加速卷积神经网络的收敛速度；使用卷积融合函数，将所述空间关系模块、所述通道关系模块和所述交叉关系网络的输出融合在一起，作为输出结果。2.如权利要求1所述的方法，其特征在于：所述空间关系模块中，将每个图像视为构建图形的节点，根据任意两个节点的视觉相似度构建图神经网络，完成行/列像素关系的建模。3.如权利要求1所述的方法，其特征在于：所述通道关系模块中，将每个通道视为构建图形的节点。4.如权利要求1所述的方法，其特征在于：将所有输入图像压缩为一个，然后使用嵌入了全局信息的特征图来学习节点的特征相似度；利用所述特征相似度，可以通过图神经网络更新节点。5.如权利要求1所述的方法，其特征在于：所述压缩层由通道维数压缩函数实现。6.如权利要求1所述的方法，其特征在于：所述恢复层由通道维数恢复函数实现。7.如权利要求1所述的方法，其特征在于：所述基于注意力的关系模块层通...

【专利技术属性】
技术研发人员：李俊，
申请(专利权)人：首都师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人