当前位置: 首页 > 专利查询>同济大学专利>正文

嵌入SENet单元的无监督单目图像深度图生成方法技术

技术编号:24710368 阅读:77 留言:0更新日期:2020-07-01 00:20
本发明专利技术涉及一种嵌入SENet单元的无监督单目图像深度图生成方法,具体为:构建深度估计网络,将目标图像输入训练好的深度估计网络获得目标图像深度图;所述的训练过程采用相机位姿估计网络;所述的深度估计网络包括编码器和解码器,所述的编码器包括7层编码卷积模块,所述的解码器包括7层解码卷积模块和7层跳跃连接的跳跃卷积模块,第1层跳跃卷积模块包括依次连接的卷积层、ReLU激活层、卷积层和ReLU激活层,第2~7层跳跃卷积模块中每块跳跃卷积模块包括残差卷积单元和SENet单元。与现有技术相比,本发明专利技术具有精度高等优点。

【技术实现步骤摘要】
嵌入SENet单元的无监督单目图像深度图生成方法
本专利技术涉及计算机视觉领域,尤其是涉及一种嵌入SENet单元的无监督单目图像深度图生成方法。
技术介绍
近年来,人工智能技术开始广泛地应用在人们日常生活的方方面面,其中,感知场景三维结构和解析场景几何关系更是有助于智能体理解现实环境。在同时定位与建图(SLAM)中,相比于单目SLAM,基于RGB-D的SLAM无论是跟踪还是构图都具有更稳健的鲁棒性。视觉里程计作为SLAM的关键,可以使用相机的相邻帧估计相机自运动,广泛应用于高级驾驶员辅助系统、自动驾驶、智能车辆、机器人等领域。现有的深度传感器都有其自身的局限性且难以满足工程应用的需求。LiDAR,基于结构光的深度传感器和立体相机,成本高且仅提供远距离物体的稀疏测量;基于结构光的深度传感器(例如Kinect)对光照敏感且耗电,在强光下会产生很多噪音,有效测量距离短;立体相机需要较大的基线和仔细校准以实现精确的三角测量,这需要大量的计算并且通常会在无特征区域失败。由上述内容可知,市场上现有的三维结构传感器都有其各自的局限性,或因成本太高而无本文档来自技高网...

【技术保护点】
1.一种嵌入SENet单元的无监督单目图像深度图生成方法,具体为:构建深度估计网络,将目标图像输入训练好的深度估计网络获得目标图像深度图;/n所述的训练过程采用相机位姿估计步骤;/n其特征在于,所述的深度估计网络包括编码器和解码器,所述的编码器包括7层编码卷积模块,所述的解码器包括交叉设置的7层解码卷积模块和7层与编码卷积模块跳跃连接的跳跃卷积模块,第1层跳跃卷积模块包括依次连接的卷积层、ReLU激活层、卷积层和ReLU激活层,第2~7层跳跃卷积模块中每层跳跃卷积模块包括残差卷积单元和SENet单元,所述的残差卷积单元的输出作为SENet单元的输入,所述的残差卷积单元的输入和输出以及SENet...

【技术特征摘要】
1.一种嵌入SENet单元的无监督单目图像深度图生成方法,具体为:构建深度估计网络,将目标图像输入训练好的深度估计网络获得目标图像深度图;
所述的训练过程采用相机位姿估计步骤;
其特征在于,所述的深度估计网络包括编码器和解码器,所述的编码器包括7层编码卷积模块,所述的解码器包括交叉设置的7层解码卷积模块和7层与编码卷积模块跳跃连接的跳跃卷积模块,第1层跳跃卷积模块包括依次连接的卷积层、ReLU激活层、卷积层和ReLU激活层,第2~7层跳跃卷积模块中每层跳跃卷积模块包括残差卷积单元和SENet单元,所述的残差卷积单元的输出作为SENet单元的输入,所述的残差卷积单元的输入和输出以及SENet单元的输出相加作为第2~7层跳跃卷积模块中每块跳跃卷积模块的输出。


2.根据权利要求1所述的一种嵌入SENet单元的无监督单目图像深度图生成方法,其特征在于,所述的相机位姿估计步骤具体为:
采集包括若干视频帧集的训练集,构建相机位姿估计网络,将每个视频帧集中参考帧Ia及Ia的相邻帧Ib输入相机位姿估计网络获得相机六自由度位姿变换关系Pab,将Ia和Ib输入深度估计网络对应获得参考帧深度图Da和相邻帧深度图Db,所述的Ia根据Pab通过形变获得合成帧I'α,所述的Da根据Pab通过形变获得合成深度图所述的Da根据Pab通过投影和双线性插值生成相邻帧深度图D′b,根据Ia、Ib、I′α、和D′b构建损失函数,利用损失函数训练深度估计网络。


3.根据权利要求2所述的一种嵌入SENet单元的无监督单目图像深度图生成方法,其特征在于,所述的损失函数L包括光度损失Lp、平滑损失Ls和几何一致性损失Lgc,计算公式为:
L=Lp+αLs+βLgc
其中α、β是Ls在L中所占有的权重;
所述的Lp的计算公式为:



其中,V为从Ia成功投影到Ib的点集,p属于集合V,|V|为V的数量,λs为图像重投影相似权重,λi为图像结构相似性权重,Iα(p)为参考帧Iα上的点,I'α(p)为根据Pab通过形变获得合成帧I'α上的点,SSIMαα'(p)为Ia和I'α的图像相似性损失。
所述的Ls的计算公式为:



其中,为沿空间方向的一阶导数;
所述的Lgc的计算公式...

【专利技术属性】
技术研发人员:王祝萍戴新柯张皓黄超
申请(专利权)人:同济大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1