基于演化神经网络架构搜索的单目深度估计方法技术

技术编号:42197845 阅读:21 留言:0更新日期:2024-07-30 18:45
本发明专利技术涉及一种基于演化神经网络架构搜索的单目深度估计方法,首先定义用于深度估计的编码器架构的神经架构搜索空间;然后利用基于遗传算法的神经架构搜索算法在用于深度估计的编码器架构的神经架构搜索空间进行搜索得到最优架构,作为单目深度估计编码器的主干网络,并在主干网络中加入金字塔卷积,单目深度估计编码器与上采样解码器一同构成单目深度估计网络;之后再对单目深度估计网络进行训练,直至网络收敛;最后将测试集输入至训练好的单目深度估计网络,获得图像中每个像素点的预测深度值。本发明专利技术将神经架构搜索算法和单目深度估计算法结合,相比较于传统手工架构编码器的单目深度估计算法,具有较高的精度和较小的参数量。

【技术实现步骤摘要】

本专利技术属于深度估计,涉及一种基于演化神经网络架构搜索的单目深度估计方法


技术介绍

1、单目深度估计技术旨在利用单个摄像头或图像来推断场景中各个物体的距离或深度信息。在视觉感知与理解、增强现实和虚拟现实、自动驾驶、三维重建和辅助医疗诊断等应用方向,单目深度估计逐渐发挥着越来越大的作用。例如,在三维建模领域,单目深度估计技术可以从普通的二维图像中恢复出三维场景的几何结构,从而实现场景的三维重建和建模。这对于虚拟旅游、文物保护、游戏开发等领域都具有重要意义;在自动驾驶领域,单目深度估计技术可以帮助车辆实时地理解周围环境,实现避障、路径规划等任务,以确保安全驾驶或飞行;在医学影像分析中,单目深度估计技术利用深度信息来量化肿瘤的大小和位置,可以帮助医生提供更准确的诊断和治疗方案。因此,单目深度估计技术在多个领域都具有重要意义,引起了工业界和学术界的广泛关注。

2、近年来,随着深度学习技术的发展,基于深度学习的单目深度估计技术在架构、数据、跨模态信息融合、学习方法和实时性等方面都取得了重要进展,为其在各种应用领域的应用提供了更多可能性。然而,在以编码本文档来自技高网...

【技术保护点】

1.一种基于演化神经网络架构搜索的单目深度估计方法,其特征在于:首先定义用于深度估计的编码器架构的神经架构搜索空间;然后利用基于遗传算法的神经架构搜索算法在所述用于深度估计的编码器架构的神经架构搜索空间进行搜索,在此过程中,将深度估计的准确度作为遗传算法的适应度值,来引导种群更新的方向,经过多次迭代演化得到最优架构;搜索结束后,将最优架构作为单目深度估计编码器的主干网络,并在主干网络中加入金字塔卷积,单目深度估计编码器与上采样解码器一同构成单目深度估计网络;之后再对所述单目深度估计网络进行训练,直至网络收敛;最后将测试集输入至训练好的所述单目深度估计网络,获得图像中每个像素点的预测深度值...

【技术特征摘要】

1.一种基于演化神经网络架构搜索的单目深度估计方法,其特征在于:首先定义用于深度估计的编码器架构的神经架构搜索空间;然后利用基于遗传算法的神经架构搜索算法在所述用于深度估计的编码器架构的神经架构搜索空间进行搜索,在此过程中,将深度估计的准确度作为遗传算法的适应度值,来引导种群更新的方向,经过多次迭代演化得到最优架构;搜索结束后,将最优架构作为单目深度估计编码器的主干网络,并在主干网络中加入金字塔卷积,单目深度估计编码器与上采样解码器一同构成单目深度估计网络;之后再对所述单目深度估计网络进行训练,直至网络收敛;最后将测试集输入至训练好的所述单目深度估计网络,获得图像中每个像素点的预测深度值。

2.根据权利要求1所述的一种演化神经网络架构搜索的单目深度估计方法,其特征在于,上采样解码器为包含拉普拉斯金字塔的上采样解码器。

3.根据权利要求2所述的一种演化神经网络架构搜索的单目深度估计方法,其特征在于,所述用于深度估计的编码器架构的神经架构搜索空间包括编码器的主干网络中的各个组成部分以及它们之间的连接方式和操作选择,具体如下:

4.根据权利要求3所述的一种...

【专利技术属性】
技术研发人员:张浩宇於志豪王新杰刘儒瑜盛伟国张兆杰谢瑞雪章庆伟
申请(专利权)人:杭州师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1