当前位置: 首页 > 专利查询>同济大学专利>正文

一种基于域适应的复杂环境下的单目图像深度估计方法技术

技术编号:30159756 阅读:13 留言:0更新日期:2021-09-25 15:12
本发明专利技术涉及一种基于域适应的复杂环境下的单目图像深度估计方法,包括:S1、构建用于白天图像深度估计的原始深度估计网络;S2、筛选出图像的刚性区域,去除图像闭塞区域和动态物体所在位置区域带来的干扰,对原始深度估计网络进行一次优化;S3、训练原始深度估计网络;S4、采用领域自适应技术对原始深度估计网络进行二次优化得到目标深度估计网络;S5、将复杂环境下的单目图像输入至目标深度估计网络,估计图像的深度信息。与现有技术相比,本发明专利技术有效解决了在复杂环境下的深度估计不精确的问题,具有鲁棒性强,准确度高等优点。准确度高等优点。准确度高等优点。

【技术实现步骤摘要】
一种基于域适应的复杂环境下的单目图像深度估计方法


[0001]本专利技术涉及机器人视觉
,尤其是涉及一种基于域适应的复杂环境下的单目图像深度估计方法。

技术介绍

[0002]基于计算机视觉的单目图像深度估计技术能够构建场景信息,使机器人能够很好的进行自定位(机器人自身在场景中的位置),是实现机器人无人系统的关键技术,对于推动无人驾驶汽车、无人搬运机器人、服务机器人的应用有着重要意义。此外,该技术还能应用于无人机、无人舰艇等领域,有着广泛的应用场景。
[0003]现有图像深度估计技术主要有以下几种:
[0004]一是基于几何的方法:该方法由Sfm(运动恢复结构:从一系列二维图像序列中估计三维结构的代表性方法)通过图像序列之间的特征对应和几何约束来计算。现有的此类方法存在以下问题:该方法很大程度上依赖于精确的特征匹配和高质量的图像序列,缺乏有效的几何解;为了获得高质量的特征点,耗时较长,会导致系统的实时性下降。
[0005]二是基于传感器的方法:该方法利用深度传感器,如RGBD相机和LIDAR,可以直接获得相应图像的深度信息;现有的此类方法主要存在以下问题:RGBD相机虽然能够直接获得RGB图像的像素级密集深度图,但测量范围有限,室外几乎不可用,而激光只能生成稀疏的三维地图;这些深度传感器的大尺寸和功耗影响了它们在小型机器人上的应用,比如无人机。
[0006]三是基于深度学习的方法:该方法可以从单个图像中以端到端的方式恢复像素级深度图。现有的此类方法主要存在以下问题:当图像中存在复杂场景时(其中复杂场景主要包括两个部分:环境变换和动态物体的干扰),深度估计的精度会大幅度下降,比如在晚上、雾天等恶劣环境下,提取的有效特征比较少,网络的性能会下降,而动态物体处的位姿和静态物体估计的位姿不同,同样会影响到深度的估计,进而导致网络架构在这些场景下的泛化能力变差。

技术实现思路

[0007]本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种基于域适应的复杂环境下的单目图像深度估计方法。
[0008]本专利技术的目的可以通过以下技术方案来实现:
[0009]一种基于域适应的复杂环境下的单目图像深度估计方法,包括:
[0010]S1、构建用于白天图像深度估计的原始深度估计网络;
[0011]S2、筛选出图像的刚性区域,去除图像闭塞区域和动态物体所在位置区域带来的干扰,对原始深度估计网络进行一次优化;
[0012]S3、训练原始深度估计网络;
[0013]S4、采用领域自适应技术对原始深度估计网络进行二次优化得到目标深度估计网
络,所述的目标深度估计网络能够估计复杂环境下的单目图像的深度,所述的复杂环境下的单目图像包括白天图像和黑夜图像;
[0014]S5、将复杂环境下的单目图像输入至目标深度估计网络,估计图像的深度信息。
[0015]优选地,所述的原始深度估计网络为编码器解码器结构的深度估计网络,所述的原始深度估计网络输出的深度图像和原始输入图像的大小相同,所述的原始深度估计网络包括日间编码器和日间解码器。
[0016]优选地,所述的原始深度估计网络包括四个下采样模块和四个上采样模块。
[0017]优选地,步骤S2具体方式为:通过位姿估计网络生成有效性掩膜过滤器,筛选出图像的刚性区域。
[0018]优选地,步骤S3所述的原始深度估计网络使用无监督端到端的方式进行训练。
[0019]优选地,步骤S3训练原始深度估计网络的具体方式为:
[0020]将白天图像分别输入至原始深度估计网络和位姿估计网络,原始深度估计网络估计深度图像,位姿估计网络估计位姿并经过有效性掩膜过滤器筛选图像的刚性区域,对估计的深度图像和位姿施加几何约束并与有效性掩膜过滤器输出的结果进行双线性插值得到合成图像,利用光度不变性原理作为合成图像质量好坏的判别依据并调整原始深度估计网络的参数。
[0021]优选地,所述的几何约束为针孔相机投影模型。
[0022]优选地,步骤S4采用领域自适应技术对原始深度估计网络进行二次优化的具体方式包括:
[0023]构建领域自适应网络,领域自适应网络中包括用于对白天图像特征编码的领域自适应日间编码器以及用于对黑夜图像特征编码的领域自适应夜间编码器;
[0024]将白天图像和黑夜图像输入至领域自适应网络,对领域自适应日间编码器和领域自适应夜间编码器进行训练使得领域自适应网络能够从黑夜图像中生成与白天图像中无法区分的特征;
[0025]将领域自适应夜间编码器替换训练好的原始深度估计网络中的日间编码器,完成原始深度估计网络的优化得到目标深度估计网络。
[0026]优选地,所述的领域自适应网络包括PatchGAN网络。
[0027]优选地,对领域自适应日间编码器和领域自适应夜间编码器进行训练时采用对抗生成学习方法进行训练。
[0028]与现有技术相比,本专利技术具有如下优点:
[0029](1)本专利技术利用深度估计网络获取输入图像每个像素的深度得到深度图,然后对预测的深度和位姿估计施加几何约束以利用光度不变性原理重构出目标图像,这一过程合理地利用了有效性掩膜过滤器,使其深度不受动态物体的影响,能够有效提升深度估计的精度。
[0030](2)本专利技术有效结合了领域自适应技术,使得网络提取的特征具有感知环境的能力,能够有效减少环境变换对深度估计的影响,提升了估计的鲁棒性。在预测深度的时候,整体网络架构采用端到端无监督训练,无需对数据进行标注,大大降低了深度估计在实际应用中的难度。
[0031](3)本专利技术使用了端到端无监督的训练方式,不需要额外的监督信号,只需要单目
视频序列即可,在训练过程中不断优化深度预测结果,得到最终的深度,具有较强的鲁棒性。
附图说明
[0032]图1是本专利技术方法的流程图;
[0033]图2是本专利技术原始深度估计网络的示意图;
[0034]图3是本专利技术几何约束的原理图;
[0035]图4是本专利
自适应网络的示意图;
[0036]图5是利用目标深度估计网络对黑夜图像进行深度估计的示意图。
具体实施方式
[0037]下面结合附图和具体实施例对本专利技术进行详细说明。注意,以下的实施方式的说明只是实质上的例示,本专利技术并不意在对其适用物或其用途进行限定,且本专利技术并不限定于以下的实施方式。
[0038]实施例
[0039]如图1所示,本实施例提供了一种基于域适应的复杂环境下的单目图像深度估计方法,包括:
[0040]S1、构建用于白天图像深度估计的原始深度估计网络;
[0041]S2、筛选出图像的刚性区域,去除图像闭塞区域和动态物体所在位置区域带来的干扰,对原始深度估计网络进行一次优化;
[0042]S3、训练原始深度估计网络;
[0043]S4、采用领域自适应技术对原始深度估计网络进行二次优化得到目标深度估计网本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于域适应的复杂环境下的单目图像深度估计方法,其特征在于,包括:S1、构建用于白天图像深度估计的原始深度估计网络;S2、筛选出图像的刚性区域,去除图像闭塞区域和动态物体所在位置区域带来的干扰,对原始深度估计网络进行一次优化;S3、训练原始深度估计网络;S4、采用领域自适应技术对原始深度估计网络进行二次优化得到目标深度估计网络,所述的目标深度估计网络能够估计复杂环境下的单目图像的深度,所述的复杂环境下的单目图像包括白天图像和黑夜图像;S5、将复杂环境下的单目图像输入至目标深度估计网络,估计图像的深度信息。2.根据权利要求1所述的一种基于域适应的复杂环境下的单目图像深度估计方法,其特征在于,所述的原始深度估计网络为编码器解码器结构的深度估计网络,所述的原始深度估计网络输出的深度图像和原始输入图像的大小相同,所述的原始深度估计网络包括日间编码器和日间解码器。3.根据权利要求2所述的一种基于域适应的复杂环境下的单目图像深度估计方法,其特征在于,所述的原始深度估计网络包括四个下采样模块和四个上采样模块。4.根据权利要求1所述的一种基于域适应的复杂环境下的单目图像深度估计方法,其特征在于,步骤S2具体方式为:通过位姿估计网络生成有效性掩膜过滤器,筛选出图像的刚性区域。5.根据权利要求1所述的一种基于域适应的复杂环境下的单目图像深度估计方法,其特征在于,步骤S3所述的原始深度估计网络使用无监督端到端的方式进行训练。6.根据权利要求5所述的一种基于域适应的复杂环境下的单目图像深度估计方法,其特征在于,步骤S3训练原始深度估计网络的...

【专利技术属性】
技术研发人员:陈启军沈梦娇刘成菊陆昱初张恒
申请(专利权)人:同济大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1