一种深度学习单目视觉地面动态目标三维重建方法技术

技术编号:39295935 阅读:28 留言:0更新日期:2023-11-07 11:03
本发明专利技术提供一种深度学习单目视觉地面动态目标三维重建方法,其特征在于,包括如下步骤:步骤一,利用动态目标掩膜优化图像重投影损失函数,利用优化后的图像重投影损失函数对深度网络进行训练并得到最优网络权重系数;步骤二,基于语义分割图提取动态目标接地点;步骤三,将步骤二的动态目标接地点作为深度网络推理的输入,得到接地点深度值,根据接地点深度值对动态目标进行三维重建。本发明专利技术能有效降低由于目标运动引起的深度值模糊现象,通过与激光雷达对同一目标的测量结果对比,本发明专利技术能准确估计动态目标的位置信息,为动态目标流定位、跟踪提供状态信息,为数字孪生场景重建提供要素感知数据。供要素感知数据。供要素感知数据。

【技术实现步骤摘要】
一种深度学习单目视觉地面动态目标三维重建方法


[0001]本专利技术涉及计算机视觉领域,具体是一种深度学习单目视觉地面动态目标三维重建方法。

技术介绍

[0002]深度学习单目视觉三维重建技术是指利用单目序列图像对深度网络进行训练,并对单帧图像进行逐像素深度恢复的过程。现有的深度学习三维重建方案(无监督训练),主要采用连续图像帧作为输入,基于像素重投影模型,选取其中一帧图像作为参考帧并计算其他帧投影到参考帧的光度损失(包括平滑损失、SSIM损失及像素重投影损失)、几何一致性损失等。上述原理成立的前提是相机处于运动状态,而场景静止。在实际应用中,道路上的行人、运动目标等均无法满足重投影法则,一方面带来整个单帧图像损失计算误差,严重降低静态区域三维重建精度;另一方面导致网络对这些动态目标的深度估计出现异常(黑洞或者距离极小值),无法估计正常的深度信息。

技术实现思路

[0003]有鉴于此,本专利技术提供一种深度学习单目视觉地面动态目标三维重建方法,主要解决深度学习单目视觉中动态目标三维重建问题,通过动态目标掩膜,滤除由于目标运动引起本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种深度学习单目视觉地面动态目标三维重建方法,其特征在于,包括如下步骤:步骤一,利用动态目标掩膜优化图像重投影损失函数,利用优化后的图像重投影损失函数对深度网络进行训练并得到最优网络权重系数;步骤二,基于语义分割图提取动态目标接地点;步骤三,将步骤二的动态目标接地点作为深度网络推理的输入,得到接地点深度值,根据接地点深度值对动态目标进行三维重建。2.如权利要求1所述的深度学习单目视觉地面动态目标三维重建方法,其特征在于:步骤一包括如下步骤:步骤1.1、动态目标提取:根据预先设定的动态目标和静态目标的像素值定义,对语义分割图进行像素遍历,提取出动态目标;步骤1.2、构建二值化动态目标掩膜:对动态目标轮廓范围内像素值进行二值化处理,存在动态目标像素的位置设为0,其余为1,从而构建动态目标掩膜;步骤1.3、基于动态目标掩膜的掩膜信息优化图像重投影损失函数;步骤1.4、基于优化后的图像重投影损失函数,对深度网络进行训练并得到最优网络权重系数。3.如权利要求2所述的深度学习单目视觉地面动态目标三维重建方法,其特征在于:步骤1.2中将动态目标轮廓范围内像素值设置为0,余下区域像素值设置为1,设置方式如下:其中u,v表示像素坐标,mask
uv
,表示(u,v)处的像素值;基于上述设置,首先将原始RGB图像灰度化,然后遍历像素点,并给对应的动态目标重新赋值,得到包含动态目标的mask掩膜。4.如权利要求3所述的深度学习单目视觉地面动态目标三维重建方法,其特征在于:步骤1.3具体为:基于所述包含动态目标的mask掩膜,构建出:loss
dy
=loss
c
*mask其中,loss
dy
为新的投影损失,loss
c
表示依据静止场景计算的投影误差,mask为二值化后的动态目标掩膜。5.如权利要求1所述的深度学习单目视觉地面动态目标三维重建方法,其特征在于:步骤二具体包括:步骤2.1、对动态目标掩膜进行形态学滤波、...

【专利技术属性】
技术研发人员:袁义华秦超楠刘琪吴微娜
申请(专利权)人:国网湖北省电力有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1