一种使用生成式对抗网络从单幅图像中估计场景几何信息的方法技术

技术编号：19482213 阅读：49 留言：0更新日期：2018-11-17 10:47

本发明专利技术提供了一种使用生成式对抗网络从单幅图像中估计场景几何信息的方法，所述方法包括：将场景的图像和图像中的若干个像素之深度输入到经训练得到的生成式神经网络，得到所述场景的深度图像；所述像素之深度是指该图像中的像素所对应的场景中的点到观测者之间的距离，所述深度图像指一副图像中每个像素之深度的总体。本发明专利技术利用场景中的图像和该图像中对应的少量的像素之深度作为输入，通过双一致性约束的生成式对抗网络来预测或估计场景的深度图像，简单有效、成本低。

全部详细技术资料下载

【技术实现步骤摘要】
一种使用生成式对抗网络从单幅图像中估计场景几何信息的方法
本专利技术属于计算机图像处理领域，涉及一种从单幅图像中估计场景几何信息的方法，特别涉及一种使用生成式对抗网络从单幅图像中估计场景几何信息的方法。
技术介绍
深度信息预测和估计，在工程应用领域中非常重要，例如，机器人、自动驾驶、增强现实(AR)和3D建模等。目前深度图像的获取方法主要有两种，分别为直接测距和间接测距。直接测距是指利用各种硬件设备直接获取深度信息。例如，TOF相机通过发射连续的近红外脉冲获取目标场景中的物体到发射器之间的距离；激光雷达通过发射激光扫描被测场景中的物体，进而获得物体表面到激光雷达之间的距离；Kinect利用光编码技术通过红外线发射机投射场景获得三维深度信息。但是，它们都有各自的局限：TOF相机通常价格高昂，易受噪声干扰；激光雷达所捕获的三维信息体现在彩色图像坐标系下是不均匀并且稀疏的，成本比较高；Kinect测量距离短，易受光线影响而产生大量噪声。间接测距是指利用同一场景的单幅或者多幅可见光图像间接进行深度估计。根据场景视点数量的不同，可分为：基于多视图的深度估计方法、基于双目图像的深度估计算法和基于单目图像的深度估计方法。基于多视图的深度估计通常对同一场景采用摄像机阵列进行图像采集，并利用多个视点图像之间的冗余信息进行深度图像的计算。基于多视图的深度估计方法能够获得与此场景对应的较为准确的深度图像，但是摄像机阵列成本高，配置麻烦，拍摄要求高，因此在实践过程中较少使用。基于双目图像的深度估计利用类似于人类双眼的两个摄像头之间的视差，通过立体匹配技术计算深度信息。基于单目图像...

【技术保护点】
1.一种使用生成式对抗网络从单幅图像中估计场景几何信息的方法，其特征在于，所述方法包括：将场景的图像和图像中的若干个像素之深度输入到经训练得到的生成式神经网络，得到所述场景的深度图像；所述像素之深度是指该图像中的像素所对应的场景中的点到观测者之间的距离，所述深度图像指一副图像中每个像素之深度的总体。

【技术特征摘要】
1.一种使用生成式对抗网络从单幅图像中估计场景几何信息的方法，其特征在于，所述方法包括：将场景的图像和图像中的若干个像素之深度输入到经训练得到的生成式神经网络，得到所述场景的深度图像；所述像素之深度是指该图像中的像素所对应的场景中的点到观测者之间的距离，所述深度图像指一副图像中每个像素之深度的总体。2.根据权利要求1所述的使用生成式对抗网络从单幅图像中估计场景几何信息的方法，其特征在于，所述生成式神经网络的训练步骤包括：步骤A：收集训练数据集：所述训练数据集包括若干样本，每个样本为一副图像和对应的深度图像；步骤B：构建生成式对抗网络架构，包括两个生成式神经网络：F和G，两个判别式神经网络：DX和DY；步骤C：将样本中的图像及其深度图像中的若干个像素之深度输入到G，得到对应的伪深度图像；将样本中的深度图像输入到F，得到对应的伪图像；所述伪图像或伪深度图像指以计算机模型生成的数据而非实际拍摄或者测量所得；步骤D：所述判别式神经网络DX对步骤C中的样本中的图像和/或伪图像进行判别，所述判别式神经网络DY对步骤C中样本中的深度图像和/或伪深度图像进行判别；步骤E：调整DX和DY以减少步骤D中的判别损失；步骤F：计算步骤C中的样本中的深度图像和G生成的伪深度图像之间的差异损失，计算样本中的图像和F生成的伪图像之间的差异损失；步骤G：调整G和F以减少步骤F中的差异损失，以增加步骤D中对伪图像和伪深度图像的判别损失；步骤H：返回步骤C进行迭代，直至满足预设的迭代条件，保存此时的生成式神经网络G为最终生成式神经网络。3.根据权利要求2所述的使用生成式对抗网络从单幅图像中估计场景几何信息的方法，其特征在于，所述步骤C具体为：将样本中的图像及其深度图像的若干个像素之深度输入到G，得到对应的伪深度图像，然后将所述伪深度图像输入到F，得到伪还原图像；将样本中的深度图像输入到F，得到对应的伪图像，然后再将所述伪图像和样本中的深度图像中的若干个像素之深度输入到G，得到伪还...

【专利技术属性】
技术研发人员：李俊，黄韬，张露娟，马震远，
申请(专利权)人：广州启辰电子科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人