一种基于图像融合的多模态图像目标检测方法技术

技术编号：22296494 阅读：47 留言：0更新日期：2019-10-15 05:28

本发明专利技术涉及一种基于图像融合的多模态图像目标检测方法，包括：1)将预先采集好的红外图像及其可见光图像，制作多模态图像数据集；2)将预处理好的成对图像作为融合模型中生成模型G的输入；生成模型G基于U‑Net等全卷积网络，以残差网络为基础的卷积神经网络作为生成网络模型结构，包括收缩过程和扩张过程，收缩路径包括多个卷积加ReLU激活层再加最大池化(Max Pooling)结构，下采样的每一步特征通道数都增加一倍，输出生成的融合图像；融合图像输入融合模型中的判别网络模型；根据训练过程中损失函数的变化，按迭代次数调节学习率训练指标，经训练，基于自有多模态图像数据集，能够得到同时保留红外图像热辐射特征和可见光图像结构性纹理特征的图像融合模型。

A Multi-modal Image Target Detection Method Based on Image Fusion

全部详细技术资料下载

【技术实现步骤摘要】
一种基于图像融合的多模态图像目标检测方法
本专利技术属于深度学习、计算机视觉和图像融合领域，涉及一种基于深度神经网络的红外-可见光的多模态图像融合模型和目标检测模型的目标检测方法。
技术介绍
在自然环境中，物体会辐射出人眼无法看到的不同频率的电磁波，称为热辐射[1]。使用红外传感器所拍摄出的红外图像，能够记录不同物体的热辐射。红外(InfraredImage,IR)图像相较于可见光(VisibleImage,VI)图像，具有如下特征：能够减少阳光，烟雾等外部环境的影响[1]；对具有明显红外热特性的物体和区域敏感。目前红外图像中的目标检测任务应用较广，包括军事、电力、建筑等方向均有重要应用。然而，红外图像不具有较高的空间分辨率和较丰富的细节和明暗对比度，可见边缘和物体细节等往往不可见。红外传感器仅从一个方面获取信息，因此无法提供所有必需的信息。对于红外图像而言，利用图像融合技术，可以针对同一个目标得到的不同的图像，以最大化提取有用信息为目的，生成包含可见光图像中丰富的细节信息和红外图像中热信息的互补的融合图像[2]，可作为目标检测这一高层视觉任务的基础；也可以应用于医疗影像、电力缺陷等具体应用任务之上。目标检测(ObjectDetection)是模式识别领域中一个基础性的研究课题，作为被检测物体的两种不同信息的表达方式，物体类别的获取和物体位置信息的采集是物体检测任务主要针对的两个问题，主要的评价指标是准确性和实时性。目标检测任务也逐渐由传统方法向深度学习方法转变，特别是RossB.Girshick教授R-CNN，FastR-CNN，FasterR-CNN这...

【技术保护点】
1.一种基于图像融合的多模态图像目标检测方法，包括下列步骤：1)将预先采集好的红外图像及其可见光图像，制作多模态图像数据集，图像格式均为单通道，包含具有结构和纹理特征的可见光图像和具有热成像信息的红外图像，按照图像模态分别制作训练集和测试集。2)将步骤1得到的训练集中的红外和可见光的多模态图像对进行包括进行裁剪和旋转平移操作在内的图像预处理，将预处理好的成对图像作为融合模型中生成模型G的输入；生成模型G基于U‑Net等全卷积网络，以残差网络为基础的卷积神经网络作为生成网络模型结构，包括收缩过程和扩张过程，收缩路径包括多个卷积加ReLU激活层再加最大池化(Max Pooling)结构，下采样的每一步特征通道数都增加一倍，输出生成的融合图像；3)将步骤2中得到生成模型G输出的融合图像输入融合模型中的判别网络模型D，判别网络模型D由一组孪生架构的卷积神经网络组成，对生成的融合图像进行无监督的质量评估，包括一组由交叉熵、重建误差、结构误差组成的损失函数，用以对融合图像和训练集中的原图像进行相似度丈量，来确定图像融合任务的完成度；同时优化生成网络G和判别网络D，方法为：输入训练集中原图像，更新G...

【技术特征摘要】
1.一种基于图像融合的多模态图像目标检测方法，包括下列步骤：1)将预先采集好的红外图像及其可见光图像，制作多模态图像数据集，图像格式均为单通道，包含具有结构和纹理特征的可见光图像和具有热成像信息的红外图像，按照图像模态分别制作训练集和测试集。2)将步骤1得到的训练集中的红外和可见光的多模态图像对进行包括进行裁剪和旋转平移操作在内的图像预处理，将预处理好的成对图像作为融合模型中生成模型G的输入；生成模型G基于U-Net等全卷积网络，以残差网络为基础的卷积神经网络作为生成网络模型结构，包括收缩过程和扩张过程，收缩路径包括多个卷积加ReLU激活层再加最大池化(MaxPooling)结构，下采样的每一步特征通道数都增加一倍，输出生成的融合图像；3)将步骤2中得到生成模型G输出的融合图像输入融合模型中的判别网络模型D，判别网络模型D由一组孪生架构的卷积神经网络组成，对生成的...

【专利技术属性】
技术研发人员：侯春萍，夏晗，杨阳，莫晓蕾，徐金辰，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人