【技术实现步骤摘要】
一种基于无监督学习和对抗生成网络的图像拼接方法
[0001]本专利技术涉及计算机视觉与人工智能领域,具体涉及一种基于无监督学习和对抗生成网络的图像拼接方法。
技术介绍
[0002]图像拼接技术是一种能够将两张存在视差但包含重叠区域的图像拼接起来获得一张无缝隙高清全景图像的技术,在自动驾驶,视频安全,虚拟现实领域中都有广泛的应用。
[0003]传统的图像拼接流程是通过手动提取两张需要拼接图像中的对应特征点,计算得到一个能够完成图像平移、旋转、缩放和理想点变换的3
×
3大小的单应性矩阵,使用单应性矩阵对一张图像进行投影变换来和另外一张图像对齐,然后将对齐后的两张图像融合得到最终的全景图。但是传统方法学习特征和融合图像的能力有限,图像对齐效果并不佳,并且通过融合阶段最终得到的图片中往往有错位和鬼影的缺陷。
[0004]得益于深度学习技术强大的自动特征学习能力,基于神经网络的图像拼接方法已经成为主流。基于深度学习的图像拼接算法主要由两阶段组成,第一阶段是图像的对准,使用卷积神经网络提取需要拼接的两张图片对应的特征点,然后通过投影变换对准图像。第二阶段是图像的融合,将对准后的两张图片作为神经网络的输入,输出得到重叠区域过渡平滑的全景拼接图像。
[0005]对于目前多数基于深度学习的拼接算法,第一阶段使用的网络结构比较简单,参数量较大,训练和推理时间都很长。并且训练都是基于监督学习的方法,使用的训练图像是通过单应性变换人工自动生成的,和真实世界图像的多景深、多平面对齐任务存在偏差,并且对 ...
【技术保护点】
【技术特征摘要】
1.一种基于无监督学习和对抗生成网络的图像拼接方法,其特征在于,包括以下步骤:(1)将需要拼接的两张图像作为参考图像和目标图像送入对准模型,经过计算得到网格顶点偏移量;(2)根据网格顶点偏移量对目标图像进行投影变换得到对准的目标图像;(3)将对准的目标图像和参考图像输入到拼接模型进行拼接,得到拼接图像。2.根据权利要求1所述的基于无监督学习和对抗生成网络的图像拼接方法,其特征在于,所述对准模型的构建过程包括:(a)构建对准模型;(b)选取公开图像数据集,在图像中裁剪、变换得到图像对,组成数据集A1,获取在真实世界中采集的重合区域比例不一、存在视差的图像对,组成数据集A2,其中,图像对包括参考图像和目标图像;(c)将数据集A1作为样本集,执行步骤(d)和(e);(d)将样本集中图像对输入到对准模型中提取特征,根据特征计算输出(n+1)
×
(m+1)
×
2个网格顶点偏移量;(e)依据网格顶点偏移量构建n
×
m个变换矩阵,将目标图像均匀分成n
×
m个图像块,采用n
×
m个变换矩阵分别对对应的图像块进行投影变换在拼合起来得到对准的目标图像,通过比较对准的目标图像和参考图像重合区域的相似度来调整对准模型的网络参数;(e)将数据集A2作为样本集,在步骤(e)基础上,重复执行步骤(d)和(e),以实现对对准模型的网络参数的微调,得到训练好的对准模型。3.根据权利要求2所述的基于无监督学习和对抗生成网络的图像拼接方法,其特征在于,所述对准模型包括结构相同的两个分支,分别用于提取图像中参考图像和目标图像的特征图,每个分支包括卷积层和N个CSP模块,每个CSP模块输出特征图,并将特征图作输入至下一个CSP模块;两个分支同一层CSP模块输出的特征图在通道方向上拼接后,使用若干个卷积层对拼接结果进行特征提取和优化后,再使用由平均池化层和全连接层组成的回归网络根据优化结果回归计算得到1个网格顶点偏移量。4.根据权利要求3所述的基于无监督学习和对抗生成网络的图像拼接方法,其特征在于,每个CSP模块包括两个子支路,子支路一由包括卷积层、批标准化层、SiLU激活层的CBS模块、ResNet的残差单元、卷积层依次连接而成,用于提取特征图,子支路二仅有一个独立的卷积层,用于提取特征图,然后将两个子支路的特征图拼接,输入到批标准化层、Leaky ReLU激活层和CBS模块,经计算输出特征图。5.根据权利要求2所述的基于无监督学习和对抗生成网络的图像拼接方法,其特征在于,所述依据网格顶点偏移量构建n
×
m个变换矩阵,包括:当存在N组网络偏移量,表示为S
i
,i=1,2,
…<...
【专利技术属性】
技术研发人员:林怡格,李晓鹏,许毅杰,
申请(专利权)人:苏州联视泰电子信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。