【技术实现步骤摘要】
复眼相机多焦距图像融合模型、方法及装置
[0001]本专利技术涉及人工智能和机器视觉领域,具体涉及一种复眼相机多焦距图像融合模型、方法及装置。
技术介绍
[0002]复眼相机由多个图像采集单元组成,每个采集单元通常具有独立的相机和数字成像系统。目前,数字图像采集主要依据小孔成像原理,借助光感元件记录图像的成像。由于成像焦距的限制,整个相机系统无法获取全聚焦图像,由此造成在光感元件聚焦范围内的景物清晰,聚焦范围外的景物模糊的问题。当一台相机在拍摄时刻采用某一种焦距进行曝光,只能清晰呈现某一景深的物体,其他景深的物体将出现不同程度的离焦模糊。复眼相机具有多个相机,可以对每个相机设置不同的焦距,从而获得不同景深物体的清晰成像的若干图像。将不同焦点不同景深的多张图像在空间域或变换域上进行处理,得到全景深清晰图像,即在同一张图像上包含更丰富的信息,增强后续图像识别的效果。多焦距图像融合技术,在目标检测、目标分割、人脸识别等众多领域被广泛使用。
[0003]现有的多焦距图像融合技术大多针对两张不同景深的图像进行融合, 并且局限于有明显景深差异的两张图像之间的融合。然而,如图1所示,自然室外环境拍摄的图像中,往往存在以下特征:近景与远景的边界线难以清晰辨别;存在显著的离焦扩散效应;存在部分区域在近焦图像和远焦图像中依然模糊。现有的众多方法中,基于决策图的方法合成图像的像素内容“选取”于多焦距图像,对依然模糊的区域无法优化,并且决策图在聚焦与离焦边界上往往不准确;现有的端到端的方法,已有的有监督方法和基于图像生成的无监督方法 ...
【技术保护点】
【技术特征摘要】
1.一种复眼相机多焦距图像融合网络模型,其特征在于:该网络模型包括编码器、多尺度统计融合器、解码器和图像还原器;该网络模型采用N张不同焦距的图像作为输入,每张图像单独输入编码器,利用自注意力编码输出四个尺度的特征,其中图像编码器的权重共享;输出为两个分支,其中一条输出由多尺度统计融合器实现,负责特征融合,对四个尺度上的特征进行融合特征,并经过特征最大、最小、均值的统计筛选获得精化的融合特征;另一条输出分支由解码器和还原器实现,负责解码四个尺度上的融合特征并重构图像;其中,所述多尺度统计融合器基于交叉参照感知融合模块RAF,具体为:输入两个大小为H
×
W
×
C的高维特征X、Y,计算X对Y的参照特征过程,先将X经过双层3
×
3的查询卷积并通过矩阵重排获得HW
×
C的Q矩阵Q
X
,将Y经过双层3
×
3的映射卷积并通过矩阵重排获得C
×
HW的K矩阵K
Y
,同时Y经过双层3
×
3的特征卷积并矩阵重排获得HW
×
C的V矩阵V
Y
;Q矩阵与K矩阵的乘积作为注意力决策矩阵,其大小为C
×
C,将V矩阵与注意力决策矩阵的乘积再与输入X相加,即获得X对Y的参照特征;同理,Y对X的参照特征计算过程与X对Y参照特征过程同,得到Y对X的参照特征。2.根据权利要求1所述的复眼相机多焦距图像融合网络模型,其特征在于:所述编码器、解码器和图像还原器均基于自参照感知模块SR进行处理,所述自参照感知模块SR包含多层,每一层经过一个注意力决策子模块A和一个自参照特征生成子模块B,子模块A将输入为H
×
W
×
C的特征图X经过批归一化和一个输入通道为C输出通道为3C的1
×
1卷积,得到三等分H
×
W
×
C,再分别经过双层3
×
3的卷积获得Q矩阵、K矩阵和V矩阵,Q矩阵与K矩阵的乘积作为注意力决策矩阵,其大小为C
×
C,将V矩阵与注意力决策矩阵的乘积再与输入X相加,即获得X的自参照特征,子模块B将子模块A获得的经过批归一化和一个输入通道为C输出通道为γC的1
×
1卷积将特征扩充为H
×
W
×
γC,并将扩充后的特征分别经过双层3
×
3的卷积获得两个输出,将其中一个输出经过激活函数后与另一个输出进行矩阵点乘,将结果经过一个输入通道为γC输出通道为C的1
×
1卷积,并与最初的输入相加,获得最终结果,维度为H
×
W
×
C。3.根据权利要求1所述的复眼相机多焦距图像融合网络模型,其特征在于:所述编码器设置有三层特征提取器,每一层采用像素重排进行降采样,将降采样后的...
【专利技术属性】
技术研发人员:邹勤,张天任,陈驰,杨必胜,王中元,
申请(专利权)人:武汉大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。