System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种自动驾驶运动图像的复原方法技术_技高网

一种自动驾驶运动图像的复原方法技术

技术编号:41331086 阅读:4 留言:0更新日期:2024-05-20 09:52
本发明专利技术提供的是一种自动驾驶运动图像的复原方法,解决了自动驾驶过程中由成像设备和物体相对运动引起的图像模糊问题。其特征在于采用深度学习的卷积神经网络算法,结合了端到端学习策略、生成对抗网络和深度残差技术,有效地消除模糊现象。本发明专利技术适用于模糊图像处理,可提高图像清晰度和质量,可广泛应用于自动驾驶系统中的图像采集及分析处理,从而提升系统的性能和可靠性,属于计算机视觉和图像处理领域。

【技术实现步骤摘要】

(一)本专利技术涉及的是一种自动驾驶运动图像的复原方法,适用于模糊图像处理,属于计算机视觉和图像处理领域。


技术介绍

0、(二)技术背景

1、在成像设备(例如相机)的曝光过程中,由于物体或相机本身的运动导致感光元件上记录下物体位置变化,进而引发图像模糊现象,降低了图像的清晰度和质量。特别是在自动驾驶场景中,这种图像模糊问题对系统的性能和可靠性产生负面影响。

2、传统的图像去模糊方法主要分为非盲去模糊和盲去模糊两种,其中非盲去模糊通过已知的运动模糊核函数进行图像修复,通过数学模型直接还原图像。然而,该方法对于现实场景中复杂的运动模糊情况需要准确估计模糊核,这在实际应用中难以实现,尤其是在处理动态场景或未知模糊的情况下。例如helstron的“image restorationbythe methodofleast squares”文献,采用恢复图像前后最小均方差的方式,提出了经典算法维纳滤波,但该方法需要提前获取清晰图像的信噪比,实际生活中一般很难做得到,若清晰图像信噪比不够准确将导致复原效果不理想。

3、盲去模糊假设模糊核未知,试图从模糊图像中恢复清晰图像和模糊核。然而,盲去模糊常面临非唯一性和高计算复杂度的问题,因为在没有先验信息的情况下,确定唯一的图像和模糊核组合是困难的,而且算法的鲁棒性通常较低。因此,这两种传统方法在实际图像去模糊应用中存在一些限制,尤其是对于处理复杂、动态或未知模糊情况时的挑战。早期的图像去模糊算法主要涉及非盲去模糊,即已知模糊图像和退化函数的情况。在频域上,一些算法如逆滤波和维纳滤波被提出,但它们对噪声敏感,难以在实际场景中应用。在空间域上,一些经典算法如r-l算法和最大熵法被提出,但它们存在计算量大、局部最优和难以收敛等问题。

4、充分利用神经网络和深度学习,并采用基于卷积神经网络的端到端方式,摒弃了传统方法中复杂的中间步骤,直接从数据中学习图像去模糊的映射。相较于传统方法,这一端到端方法更注重实现简化和提高计算效率,更高效,尤其在处理复杂、动态或未知模糊情况时表现出色,为图像去模糊任务带来了新的突破。


技术实现思路

0、(三)
技术实现思路

1、本专利技术的目的在于解决自动驾驶过程中由成像设备和物体相对运动引起的图像模糊问题,克服了传统方法中对参数要求高和计算量大的问题,提高了复原图像的质量。

2、为了实现以上目的,本专利技术提供了一种自动驾驶运动图像的复原方法,包括:

3、步骤一、分析成像设备和物体相对运动状态下图像退化过程,建立匀速直线运动模糊图像的退化模型。

4、进一步地,所述步骤一充分考虑到相机延时的影响,假设快门开启和关闭时间非常短,可近似认为光学成像过程未受运动干扰,初步得到匀速直线运动模糊图像为:

5、

6、其中,h(x,y)表示匀速直线运动模糊图像的退化模型,l为运动模糊长度,θ为运动模糊角度,x,y表示空间坐标。

7、步骤二、准备数据集,其中一部分用作训练模型的训练集,另一部分用于测试训练后网络性能的测试集。

8、步骤三、采用去除非匀速运动模糊的卷积神经网络,引入端到端的去模糊网络,建立基于生成对抗性网络的退化图像复原模型,专门应对成像设备和被成像物体相对运动引起的图像模糊问题,以提高图像复原的效果。

9、进一步地,所述步骤三中使用传统法进行图像复原,研究的是非盲去模糊,因此所有模糊图像均由自己设计模糊核生成,得到了模糊核的频域表达式为:

10、

11、式中:u=0,1,2,…,m-1,v=1,2,…,n-1。

12、其中,a和b分别为像素点在曝光时间t内在x和y方向上的位移,m、n为分别为图像的行、列数。

13、进一步地,所述步骤三中,生成器模型结构使用“先下采样,后上采样”的卷积方式,这种方式可以表现出样本分布中更好的潜在特征。

14、鉴别器采用了较为简单的网络结构,它通过卷积从生成器输出的图像中提取具有代表性的特征图,再将该特征图与清晰图像的特征图进行比较,通过损失函数的映射关系计算两者之间的差异,最终给出判别结果。

15、在生成对抗网络中,生成器模型的损失由对抗项和内容型两部分组成,对抗项损失函数旨在使生成的图片更接近真实图像,内容项数值越小则表明图像越清晰,总的损失函数表示为:

16、ltota=ladv+lcont

17、其中,ltota为对抗项,lcont为内容项,ladv的计算公式如下

18、

19、为了解决整个网络架构中,如果所有归一化层都使用相同的归一化器,网络性能达不到最佳状态的问题,本专利技术引入了可切换归一化(switchable normalization,sn)技术,有效解决了网络架构中同一归一化器使用问题,为提升整体性能提供了可行的解决方案。

20、为了解决使用relu(线性整流函数)等激活函数可能导致神经元“坏死”的问题,本专利技术采用了新型激活函数——mish(非线性)激活函数。有效解决了使用relu等激活函数可能引发的问题,为神经网络的训练提供了更为稳定和高效的解决方案。mish激活函数定义为:

21、f(x)=xtanh[ln(1+ex)]

本文档来自技高网...

【技术保护点】

1.一种自动驾驶运动图像的复原方法,其特征是,它采用深度学习的卷积神经网络算法,结合端到端学习策略、生成对抗网络和深度残差技术,有效地消除模糊现象。

2.根据权利要求书1所述的方法,其特征是,卷积神经网络可通过卷积层有效地从输入图像中提取特征。

3.根据权利要求书1所述的方法,其特征是,采用端到端的去模糊方法,网络可以直接从输入(模糊图像)到输出(清晰图像)进行学习,无需手动定义中间步骤或特征。

4.根据权利要求书3所述的方法,其特征是,归一化函数选择可切换归一化;激活函数选择Mish(非线性)激活函数。

5.根据权利要求书1所述的方法,其特征是,生成对抗网络的引入提供了对抗性的训练机制。

6.根据权利要求书5所述的方法,其特征是,生成对抗网络(GAN)由生成器和鉴别器两个子网络组成,二者相互对抗,通过博弈的方式进行训练,以达到生成逼真样本的目的。

7.根据权利要求书6所述的方法,其特征是,生成器采用先下采样(降低分辨率),后上采样(提高分辨率)的结构。

【技术特征摘要】

1.一种自动驾驶运动图像的复原方法,其特征是,它采用深度学习的卷积神经网络算法,结合端到端学习策略、生成对抗网络和深度残差技术,有效地消除模糊现象。

2.根据权利要求书1所述的方法,其特征是,卷积神经网络可通过卷积层有效地从输入图像中提取特征。

3.根据权利要求书1所述的方法,其特征是,采用端到端的去模糊方法,网络可以直接从输入(模糊图像)到输出(清晰图像)进行学习,无需手动定义中间步骤或特征。

4.根据权利要求书3所述的方法,其...

【专利技术属性】
技术研发人员:陈婷婷胡江波李祖贤张玉婷张文涛张震王渊明
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1