用于改进确定深度图、相对姿势或语义分割的过程的设备和方法技术

技术编号：34287819 阅读：56 留言：0更新日期：2022-07-27 08:44

本发明专利技术涉及先进驾驶辅助系统(advanced driver assistance system，ADAS)、计算机视觉和机器学习(machine learning，ML)领域。本发明专利技术提供了一种基于ML的方法，用于根据合成图像(根据真实图像或虚拟图像生成)训练神经网络，以改进确定深度图、相对姿势或语义分割的过程。因此，本发明专利技术提供了一种用于确定深度图(101)、相对姿势(102)或语义分割(103)的设备(100)。所述设备(100)包括：神经网络(104)，用于在推理阶段根据输入图像(105)确定所述深度图(101)、所述相对姿势(102)或所述语义分割(103)；生成器(106)，用于在训练阶段根据真实图像(108)或虚拟图像(109)并根据损失函数(110)生成合成图像(107)；根据所述合成图像(107)训练所述神经网络(104)；其中，所述损失函数(110)包括语义边缘函数(111)。函数(110)包括语义边缘函数(111)。函数(110)包括语义边缘函数(111)。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于改进确定深度图、相对姿势或语义分割的过程的设备和方法

[0001]本专利技术涉及先进驾驶辅助系统(advanced driver assistance system，ADAS)、计算机视觉和机器学习(machine learning，ML)领域。本专利技术提供了一种基于ML的方法，用于根据合成图像(根据真实图像或虚拟图像生成)训练神经网络，以改进确定深度图、相对姿势或语义分割(例如，可用于训练自动驾驶车辆的自动驾驶仪)的过程。此外，本专利技术涉及域适应，例如，通过在虚拟图像上训练神经网络和在真实图像上测试来解决计算机视觉问题。

技术介绍

[0002]根据传感器输入进行相对姿势、深度图或语义分割的估计是机器人、ADAS或自动驾驶系统的重要任务。例如，用于进行所述估计的传感器输入来自视觉传感器(例如由数码相机拍摄的输入图像)。根据输入图像估计的信息(深度图、语义分割或相对姿势)可(与输入图像一起)用于机器人、ADAS或自动驾驶系统的进一步训练。例如，可以根据输入图像并根据对应的相对姿势、深度图或语义分割训练车辆的自动驾驶仪。
[0003]随着神经网络的快速发展，为了解决计算机视觉问题，立体匹配或自监督深度学习方法等估计技术取得了进步，但需要大量真实高质量的立体图像或真实序列图像作为估计训练的输入图像。即使真实立体图像或真实序列图像很容易生成，但也很难创建对应于所述真实图像的准确深度图、相对姿势或语义分割(可用作进一步训练的地面真值)。
[0004]而创建具有关于深度图、相对姿势或语义分割的对应的准确信...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于确定深度图(101)、相对姿势(102)或语义分割(103)的设备(100)，其特征在于，所述设备(100)包括：
‑
神经网络(104)，用于在推理阶段根据输入图像(105)确定所述深度图(101)、所述相对姿势(102)或所述语义分割(103)；
‑
生成器(106)，用于在训练阶段：根据真实图像(108)或虚拟图像(109)并根据损失函数(110)生成合成图像(107)；根据所述合成图像(107)训练所述神经网络(104)；其中，所述损失函数(110)包括语义边缘函数(111)。2.根据权利要求1所述的设备(100)，其特征在于，所述语义边缘函数(111)用于维护所述合成图像(107)中的语义梯度信息和/或边缘信息。3.根据权利要求1或2所述的设备(100)，其特征在于，还包括第一鉴别器(201)和第二鉴别器(202)，所述生成器(106)还用于在所述训练阶段将所述合成图像(107)提供给所述第一鉴别器(201)或所述第二鉴别器(202)，以训练所述神经网络(104)。4.根据权利要求3所述的设备(100)，其特征在于，所述生成器(106)还用于，在所述训练阶段根据提供了所述合成图像(107)的所述鉴别器(201，202)的确定结果，训练所述神经网络(104)。5.根据权利要求3或4所述的设备(100)，其特征在于，所述生成器(106)还用于在所述训练阶段将所述合成图像(107)随机提供给所述第一鉴别器(201)或所述第二鉴别器(202)。6.根据权利要求4或5所述的设备(100)，其特征在于，所述第一鉴别器(201)还用于在所述训练阶段确定所述生成器(106)根据虚拟图像(109)生成的合成图像(107)是虚假图像，并确定所述虚拟图像(109)是原始图像；其中，所述第二鉴别器(202)还用于在所述训练阶段确定所述生成器(106)根据真实图像(108)生成的合成图像(107)是虚假图像，并确定所述真实图像(108)是原始图像。7.根据上述权利要求中任一项所述的设备(100)，其特征在于，还用于根据所述合成图像(107)训练所述神经网络(104)，以用于确定以下至少一项：深度图(101)...

【专利技术属性】
技术研发人员：阿基尔，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人