用于训练神经网络模型的合成图像的生成制造技术

技术编号：21972816 阅读：24 留言：0更新日期：2019-08-28 01:45

本发明专利技术公开了用于训练神经网络模型的合成图像的生成。训练深度神经网络需要大量经标记的训练数据。常规地，通过收集手动标记的真实图像来生成经标记的训练数据，这非常耗时。使用域随机化技术生成自动标记的训练数据，而不是手动标记训练数据集。所生成的训练数据可用于训练神经网络以用于对象检测和分割(标记)任务。在一实施例中，所生成的训练数据包括通过渲染3D场景中的三维(3D)感兴趣对象而生成的合成输入图像。在一实施例中，所生成的训练数据包括通过在2D背景图像上渲染3D的感兴趣对象而生成的合成输入图像。3D的感兴趣对象是训练神经网络以检测和/或标记的对象。

Composite Image Generation for Training Neural Network Model

全部详细技术资料下载

【技术实现步骤摘要】
用于训练神经网络模型的合成图像的生成优先权要求本申请要求2018年2月14日提交的序列号为62/630,722(案卷号为NVIDP1212+/17BL0293US01)、标题为“使用非现实合成数据训练计算机视觉系统的系统和方法(ASystemandMethodforTrainingaComputerVisionSystemUsingNon-RealisticSyntheticData)”的美国临时申请的优先权，其全部内容通过引用并入本文。
本公开涉及合成图像，并且更具体地涉及生成用于训练神经网络模型的合成图像。
技术介绍
训练深度神经网络需要大量经标记的训练数据。常规地，通过收集手动标记的真实图像来生成经标记的训练数据，手动标记非常耗时。需要解决与现有技术相关联的这些问题和/或其他问题。
技术实现思路
描述了用于生成自动经标记的训练数据的域随机化技术。生成的训练数据可用于训练神经网络以用于对象检测和分割任务。在一实施例中，所生成的训练数据包括通过渲染3D场景中的三维(3D)感兴趣对象而生成的合成输入图像。在一实施例中，所生成的训练数据包括通过在2D背景图像上渲染3D感兴趣对象而生成的合成输入图像。3D感兴趣对象是训练神经网络以检测和/或分割的对象。公开了一种用于生成用于训练神经网络模型的合成图像的方法、计算机可读介质和系统。渲染三维(3D)感兴趣对象以产生感兴趣对象的渲染图像，其中输入图像包括感兴趣对象的渲染图像和背景图像。计算与感兴趣对象相对应的任务专用训练数据，并且与感兴趣对象相对应的任务专用训练数据和输入图像作为测试对被包括在用于训练神经网络的训练数据集...

【技术保护点】
1.一种计算机实现的方法，包括：渲染三维(3D)感兴趣对象以产生所述感兴趣对象的渲染图像，其中输入图像包括所述感兴趣对象的所述渲染图像和背景图像；计算与所述感兴趣对象相对应的任务专用训练数据；以及将与所述感兴趣对象相对应的所述任务专用训练数据和所述输入图像作为测试对包括在用于训练神经网络的训练数据集中。

【技术特征摘要】
2018.02.14 US 62/630,722;2019.01.24 US 16/256,8201.一种计算机实现的方法，包括：渲染三维(3D)感兴趣对象以产生所述感兴趣对象的渲染图像，其中输入图像包括所述感兴趣对象的所述渲染图像和背景图像；计算与所述感兴趣对象相对应的任务专用训练数据；以及将与所述感兴趣对象相对应的所述任务专用训练数据和所述输入图像作为测试对包括在用于训练神经网络的训练数据集中。2.根据权利要求1所述的计算机实现的方法，还包括接收用于渲染所述3D感兴趣对象的光的位置和取向。3.根据权利要求2所述的计算机实现的方法，还包括接收用于渲染所述3D感兴趣对象的光的颜色。4.根据权利要求2所述的计算机实现的方法，还包括接收用于渲染所述3D感兴趣对象的光的强度。5.根据权利要求1所述的计算机实现的方法，还包括渲染一个或更多个3D几何形状以产生一个或更多个经渲染的几何形状，其中所述一个或更多个经渲染的几何形状包括在所述输入图像中。6.根据权利要求5所述的计算机实现的方法，其中，从所述任务专用训练数据中省略所述一个或更多个经渲染的几何形状。7.根据权利要求5所述的计算机实现的方法，其中，渲染所述一个或更多个3D几何形状包括将纹理映射应用于所述一个或更多个3D几何形状中的至少一个3D几何形状。8.根据权利要求1所述的计算机实现的方法，还包括：渲染附加的3D感兴趣对象以产生附加的经渲染的感兴趣对象，其中所述附加的经渲染的感兴趣对象包括在所述输入图像中；以及计算对应于所述附加的感兴趣对象的附加任务专用训练数据，其中所述附加任务专用训练数据包括在所述测试对中。9.根据权利要求8所述的计算机实现的方法，其中，所述附加的经渲染的感兴趣对象遮挡所述经渲染的感兴趣对象的一部分，并且当所述部分大于预定阈值时，修改对应于所述感兴趣对象的所述任务特定训练数据。10.根据权利要求1所述的计算机实现的方法，其中渲染所述3D感...

【专利技术属性】
技术研发人员：J·特伦布莱，A·普拉卡什，M·A·布罗菲，V·扬帕尼，C·阿尼尔，S·T·伯奇菲尔德，T·H·多，D·J·阿库纳·马雷罗，
申请(专利权)人：辉达公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人