训练神经网络的方法、训练神经网络的系统以及神经网络技术方案

技术编号：35366530 阅读：17 留言：0更新日期：2022-10-29 18:06

本公开涉及训练神经网络的方法、训练神经网络的系统以及神经网络。一种用于训练第一神经网络，以在图像输入到第一神经网络时，检测在该图像上可见并且属于给定对象类别的对象的视点的方法，包括：提供不同视点下的多对图像的数据集，提供被配置成能够得出对象的外观信息的第二神经网络，提供被配置成能够使用外观信息和视点，得出所述类别的对象的合成图像的第三神经网络，联合训练第一神经网络、第二神经网络和第三神经网络。神经网络和第三神经网络。神经网络和第三神经网络。

全部详细技术资料下载

【技术实现步骤摘要】
训练神经网络的方法、训练神经网络的系统以及神经网络

[0001]本公开涉及一种训练神经网络的方法、训练神经网络的系统以及神经网络。

技术介绍

[0002]已经提出通过使用在计算机系统上实现的神经网络来检测由相机获取的图像上的三维对象。通常，可取的是还获得与图像上可见的对象的6D姿态有关的信息。“6D姿态”是一种本领域技术人员公知的表示对象的三维位置和三维定向的组合的表达。获得6D姿态在其中检测和操纵对象的机器人领域中特别有用。对于在驾驶场景中确定对象的定向以允许自主或部分自主驾驶也是有用的。
[0003]图像上可见的对象的视点是这样一种期望的与6D姿态有关的信息。视点可以被定义为对象相对于用于获取图像的相机的方位角、仰角和面内旋转。神经网络也已经用于自动确定图像上可见的对象的视点。
[0004]对象视点估计是为了使自主系统能够理解三维(3D)世界而需要的关键组件之一。已观察到受控环境中的已知方法能够成功地检测对象的视点。这些已知方法受益于现代的可学习表征并已被证明有助于诸如对象检测和3D重建之类的其他视觉任务，并且已用于各种应用。例如，人工神经网络(下文中称为神经网络)已用于检测视点。
[0005]为了获得进行自动确定图像上可见的对象的视点的任务的神经网络，必须进行神经网络的训练阶段。该训练阶段通常使用一组打标记的训练图像来进行。所谓打标记是指为该组训练图像中的每个图像提供感兴趣对象的视点；所提供的视点被称为真值(ground truth)。然后，训练然后在于将来自训练集的图像输入到神经网络，...

【技术保护点】

【技术特征摘要】
1.一种用于训练第一神经网络以在图像输入到第一神经网络时检测对象的视点的方法，所述对象在该图像上可见、居中并属于给定对象类别，其特征在于所述方法包括：提供多对图像的数据集，每对图像包括第一图像和第二图像，在第一图像上，属于所述类别的对象在第一视点下可见并居中，在第二图像上，同一对象在与第一视点不同的第二视点下可见并居中，提供第二神经网络，第二神经网络被配置成在图像输入到第二神经网络时，能够得出在该图像上可见并属于所述类别的对象的外观信息，提供第三神经网络，第三神经网络被配置成在对象的外观信息和视点输入到第三神经网络时，能够得出所述类别的对象的合成图像，通过适配第一神经网络、第二神经网络和第三神经网络的参数，联合训练第一神经网络、第二神经网络和第三神经网络，以便使以下两者之间的距离最小化：出自所述多对图像的数据集的一对图像中的第一图像的至少一部分，该部分显示在图像上可见的对象，和由第三神经网络得出的合成图像，第三神经网络接收通过将第一图像输入到第一神经网络而得出的视点和通过将该对图像中的第二图像输入到第二神经网络而得出的外观信息作为输入。2.按照权利要求1所述的方法，其特征在于使用感知损失来定义所述距离。3.按照权利要求1或2所述的方法，其特征在于第一神经网络被配置成得出多个视点假设，以及其中与最小距离关联的视点假设被用于适配所述参数。4.按照权利要求3所述的方法，其特征在于第一神经网络还被配置成能够得出被配置成能够指示最佳假设的指标。5.按照权利要求1
‑
4任意之一所述的方法，其特征在于第三神经网络使用对象条件生成处理，以使用外观信息作为输入和/或使用视点作为输入。6.按照权利要求5所述的方法，其特征在于第三神经网络被配置成还接收通用代码作为输入，并包括被配置成接收所述通用代码作为输入的多个连续的三维卷积层，其中每个三维卷积层的输出被配置成通过使用用作第三神经网络的输入的外观信息作为参数的给定仿射变换进行变换，以便获得变换后输出，其中第三神经网络包括渲染模块，渲染模块被配置成接收最后的三维卷积层的变换后输出和用作第三神经网络的输入的视点作为输入。7.按照权利要求6所述的方法，其特征在于渲染模块包括旋转模块，旋转模块被配置成按照用作第三神经网络的输入的视点，对渲染模块接收的变换后输出进行旋转，并被配置成输出旋转后输出，透视模块，透视模块被配置成对旋转后输出应用透视，和光线追踪模...

【专利技术属性】
技术研发人员：斯文，
申请(专利权)人：爱丁堡大学管理处，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人