用于双目视觉匹配的神经网络搜索方法及设备技术

技术编号：26891647 阅读：17 留言：0更新日期：2020-12-29 16:10

本发明专利技术提供一种用于双目视觉匹配的神经网络搜索方法及设备，所述方法包括：获取训练数据，所述训练数据包括双目图像及相应的视差数据；利用所述训练数据在单元级搜索空间和网络级搜索空间中搜索双目视觉匹配模型中的特征提取网络和三维匹配网络的结构；通过搜索过程中得到的视差数据与所述训练数据中的视差数据的差异，优化所述第一权重参数集、所述第二权重参数集以及网络权重直至搜索过程收敛；根据第一权重参数集的值保留至少部分所述操作，以及根据第二权重参数集的值保留至少一条路径，并基于保留的操作和路径得到优化的特征提取网络和三维匹配网络。

全部详细技术资料下载

【技术实现步骤摘要】
用于双目视觉匹配的神经网络搜索方法及设备
本专利技术涉及神经网络搜索
，具体涉及一种用于双目视觉匹配的神经网络搜索方法及设备。
技术介绍
人类具有通过双眼观测、重建和理解三维世界的能力，对于场景的准确感知和重建对于人类的决策至关重要。双目视觉匹配(Stereomatching)致力于赋予计算机类似人类双眼的能力，其研究目标是由双目相机获得的二维彩色图像计算出视差图(disparitymap)。在获得了视差信息后，根据投影模型很容易地可以得到原始图像的深度信息和三维信息，因此该技术在三维场景重建、机器人、自动驾驶领域都有广泛的应用。双目视觉匹配不但是计算机视觉领域的一个难点问题，而且近二十年来一直是计算机视觉研究的重要问题之一。双目视觉匹配通过遍历参考图像中的每一个像素，根据视差范围中的每一个视差值找到对应目标图像的像素，而后进行代价聚合计算。随着大规模数据集的出现、计算力的快速发展，卷积神经网络已经在双目视觉匹配中有所成效。目前大多数基于深度学习的双目视觉匹配方法大致分为两类，一是直接回归视差值，二是基于匹配代价量(costvolume)的方法。直接回归视差的方法是对输入图像中的每个像素直接回归，并不考虑双目视觉匹配中的几何约束。通常采用包含二维卷积的大型U形编码器和解码器网络来实现的。此类方法需要依靠大量数据驱动，且泛化能力较差。相反，基于匹配三维代价量的方法利用半全局匹配的概念，通过平移每个视差的特征，级联地构建四维特征量。为减少人类在设计神经网络方面的工作，神经网络搜索(NeuralArc...

【技术保护点】
1.一种用于双目视觉匹配的神经网络搜索方法，其特征在于，包括：/n获取训练数据，所述训练数据包括双目图像及相应的视差数据；/n利用所述训练数据在单元级搜索空间和网络级搜索空间中搜索双目视觉匹配模型中的特征提取网络和三维匹配网络的结构，其中所述单元级搜索空间包括基本搜索单元，所述基本搜索单元是具有多个节点的完全连接的有向无环图，其中各个节点之间的边表示可选的操作，且各边对应于第一权重参数集，多个所述基本搜索单元层级排列构成所述网络级搜索空间，其中每个所述基本搜索单元与前一层中的上一级和下一级之间有路径连接，各级中的所述基本搜索单元的分辨率不同，各个路径对应于第二权重参数集，所述网络级搜索空间的超参数包括所述分辨率和层数；/n通过搜索过程中得到的视差数据与所述训练数据中的视差数据的差异，优化所述第一权重参数集、所述第二权重参数集以及网络权重直至搜索过程收敛；/n根据第一权重参数集的值保留至少部分所述操作，以及根据第二权重参数集的值保留至少一条路径，并基于保留的操作和路径得到优化的特征提取网络和三维匹配网络。/n

【技术特征摘要】
1.一种用于双目视觉匹配的神经网络搜索方法，其特征在于，包括：
获取训练数据，所述训练数据包括双目图像及相应的视差数据；
利用所述训练数据在单元级搜索空间和网络级搜索空间中搜索双目视觉匹配模型中的特征提取网络和三维匹配网络的结构，其中所述单元级搜索空间包括基本搜索单元，所述基本搜索单元是具有多个节点的完全连接的有向无环图，其中各个节点之间的边表示可选的操作，且各边对应于第一权重参数集，多个所述基本搜索单元层级排列构成所述网络级搜索空间，其中每个所述基本搜索单元与前一层中的上一级和下一级之间有路径连接，各级中的所述基本搜索单元的分辨率不同，各个路径对应于第二权重参数集，所述网络级搜索空间的超参数包括所述分辨率和层数；
通过搜索过程中得到的视差数据与所述训练数据中的视差数据的差异，优化所述第一权重参数集、所述第二权重参数集以及网络权重直至搜索过程收敛；
根据第一权重参数集的值保留至少部分所述操作，以及根据第二权重参数集的值保留至少一条路径，并基于保留的操作和路径得到优化的特征提取网络和三维匹配网络。

2.根据权利要求1所述的方法，其特征在于，所述基本搜索单元包括多个中间节点，各个所述中间节点同时接收前两层基本搜索单元输出的特征数据。

3.根据权利要求1或2所述的方法，其特征在于，所述基本搜索单元包括一个输出节点，所述输出节点是由本单元的每一个中间节点及其前一层的基本搜索单元的输出节点融合形成的。

4.根据权利要求1所述的方法，其特征在于...

【专利技术属性】
技术研发人员：陈雪莲，刘从新，戈宗元，赵昕，和超，张大磊，
申请(专利权)人：上海鹰瞳医疗科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人