一种图像训练数据集生成方法、装置、设备及介质制造方法及图纸

技术编号:23893888 阅读:27 留言:0更新日期:2020-04-22 07:37
本申请公开了一种图像训练数据集生成方法、装置、设备及计算机可读存储介质,其中,该方法包括:对目标场景进行扫描,以获取目标场景的三维数据;将三维数据输入到三维CG软件中,利用三维CG软件构建与目标场景对应的三维模型;对三维模型进行UV贴图展开,得到与目标场景对应的虚拟场景;触发三维CG软件的引擎,利用引擎及虚拟场景生成多张图像,并在生成图像时对图像进行标签的标注,以得到图像训练数据集。本申请公开的上述技术方案,通过对图像的自动生成和标签的自动标注来提高图像训练数据集的生成效率,并降低图像训练数据集的生成成本。

【技术实现步骤摘要】
一种图像训练数据集生成方法、装置、设备及介质
本申请涉及深度学习
,更具体地说,涉及一种图像训练数据集生成方法、装置、设备及计算机可读存储介质。
技术介绍
深度学习是机器学习的分支,是一种以人工神经网络为架构,对数据进行表征学习的算法。在对图像数据进行模型计算时需要依赖包含海量图像的图像训练数据集进行实现。目前,常通过手动方式来进行图像训练数据集的生成。具体地,利用相机或手机从各个角度拍摄目标场景,并拍摄目标场景的各个位置,以得到大量的图像,然后,借助labelme、labelimg等工具对各个图像进行人工标注,以得到图像训练数据集,这种方法可以为深度学习提供较为准确的图像训练数据集,但是,由于需要人工拍摄大量的图像且需要人工对每个张图进行标注,因此,则会降低图像训练数据集的生成效率,并会导致图像训练数据集的生成成本比较高。综上所述,如何提高图像训练数据集的生成效率,并降低图像训练数据集的生成成本,是目前本领域技术人员亟待解决的技术问题。
技术实现思路
有鉴于此,本申请的目的是提供一种图像训练数据集生成方法、装置、设备及计算机可读存储介质,用于提高图像训练数据集的生成效率,并降低图像训练数据集的生成成本。为了实现上述目的,本申请提供如下技术方案:一种图像训练数据集生成方法,包括:对目标场景进行扫描,以获取所述目标场景的三维数据;将所述三维数据输入到三维CG软件中,利用所述三维CG软件构建与所述目标场景对应的三维模型;对所述三维模型进行UV贴图展开,得到与所述目标场景对应的虚拟场景;触发所述三维CG软件的引擎,利用所述引擎及所述虚拟场景生成多张图像,并在生成所述图像时对所述图像进行标签的标注,以得到图像训练数据集。优选的,在对所述三维模型进行UV贴图展开之后,还包括:调用所述三维CG软件的引擎,利用所述三维CG软件的引擎根据所述目标场景设置虚拟场景参数。优选的,触发所述三维CG软件的引擎,包括:利用Python编写脚本,并利用所述脚本触发所述三维CG软件的引擎。优选的,在利用所述引擎及所述虚拟场景生成多张图像之前,还包括:接收输入的图像生成参数;相应地,利用所述引擎及所述虚拟场景生成多张图像,包括:利用所述引擎及所述虚拟场景根据所述图像生成参数生成多张所述图像。优选的,所述三维CG软件为Blender。优选的,对目标场景进行扫描,包括:利用激光点云设备对所述目标场景进行扫描。一种图像训练数据集生成装置,包括:扫描模块,用于对目标场景进行扫描,以获取所述目标场景的三维数据;输入模块,用于将所述三维数据输入到三维CG软件中,利用所述三维CG软件构建与所述目标场景对应的三维模型;UV贴图展开模块,用于对所述三维模型进行UV贴图展开,得到与所述目标场景对应的虚拟场景;生成图像模块,用于触发所述三维CG软件的引擎,利用所述引擎及所述虚拟场景生成多张图像,并在生成所述图像时对所述图像进行标签的标注,以得到图像训练数据集。优选的,还包括:调用模块,用于在对所述三维模型进行UV贴图展开之后,调用所述三维CG软件的引擎,利用所述三维CG软件的引擎根据所述目标场景设置虚拟场景参数。一种图像训练数据集生成设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如上述任一项所述的图像训练数据集生成方法的步骤。一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述的图像训练数据集生成方法的步骤。本申请提供了一种图像训练数据集生成方法、装置、设备及计算机可读存储介质,其中,该方法包括:对目标场景进行扫描,以获取目标场景的三维数据;将三维数据输入到三维CG软件中,利用三维CG软件构建与目标场景对应的三维模型;对三维模型进行UV贴图展开,得到与目标场景对应的虚拟场景;触发三维CG软件的引擎,利用引擎及虚拟场景生成多张图像,并在生成图像时对图像进行标签的标注,以得到图像训练数据集。本申请公开的上述技术方案,通过对目标场景进行扫描得到三维数据,并将三维数据输入到三维CG软件中,利用三维CG软件构建三维模型,并对三维模型进行UV贴图展开以得到与目标场景对应的虚拟场景,然后,触发三维CG软件的引擎,以利用引擎和虚拟场景生成多张图像,在生成图像时对图像进行标签的标注,以实现图像的自动生成和标签的自动标注,即实现图像训练数据集的自动生成,因此,相较于目前需要人工拍摄多张图像且人工对多张图像进行标注而言,本申请可以提高图像训练数据集的生成效率,降低图像训练数据集的生成成本。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本申请实施例提供的一种图像训练数据集生成方法的流程图;图2为本申请实施例提供的一种图像训练数据集生成装置的结构示意图;图3为本申请实施例提供的一种图像训练数据集生成设备的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。参见图1,其示出了本申请实施例提供的一种图像训练数据集生成方法的流程图,本申请实施例提供的一种图像训练数据集生成方法,可以包括:S11:对目标场景进行扫描,以获取目标场景的三维数据。在需要利用目标场景生成图像训练数据集以进行模型计算时,可以对目标场景进行扫描,以获取到目标场景的三维数据,从而便于根据三维数据对目标场景进行建模。S12:将三维数据输入到三维CG软件中,利用三维CG软件构建与目标场景对应的三维模型。在得到目标场景的三维数据之后,将其输入到三维CG(ComputerAnimation,电脑动画制作)软件中,利用三维CG软件根据三维数据进行处理和模型的构建,以得到与目标场景对应的三维模型。利用三维CG软件进行三维模型建立的速度比较快,而且所建立的三维模型与目标场景比较接近。S13:对三维模型进行UV贴图展开,得到与目标场景对应的虚拟场景。在得到三维模型之后,可以对三维模型进行UV贴图展开,以对三维模型表面进行纹理包装,最终得到与目标场景对应且与目标场景十分接近的虚拟场景,以使得最终根据虚拟场景所生成的图像可以更接近目标场景,从而提高图像的准确性和真实性。其中,UV贴图展开中的U指的是二维空间的水平轴、V指的是二维空本文档来自技高网...

【技术保护点】
1.一种图像训练数据集生成方法,其特征在于,包括:/n对目标场景进行扫描,以获取所述目标场景的三维数据;/n将所述三维数据输入到三维CG软件中,利用所述三维CG软件构建与所述目标场景对应的三维模型;/n对所述三维模型进行UV贴图展开,得到与所述目标场景对应的虚拟场景;/n触发所述三维CG软件的引擎,利用所述引擎及所述虚拟场景生成多张图像,并在生成所述图像时对所述图像进行标签的标注,以得到图像训练数据集。/n

【技术特征摘要】
1.一种图像训练数据集生成方法,其特征在于,包括:
对目标场景进行扫描,以获取所述目标场景的三维数据;
将所述三维数据输入到三维CG软件中,利用所述三维CG软件构建与所述目标场景对应的三维模型;
对所述三维模型进行UV贴图展开,得到与所述目标场景对应的虚拟场景;
触发所述三维CG软件的引擎,利用所述引擎及所述虚拟场景生成多张图像,并在生成所述图像时对所述图像进行标签的标注,以得到图像训练数据集。


2.根据权利要求1所述的图像训练数据集生成方法,其特征在于,在对所述三维模型进行UV贴图展开之后,还包括:
调用所述三维CG软件的引擎,利用所述三维CG软件的引擎根据所述目标场景设置虚拟场景参数。


3.根据权利要求1所述的图像训练数据集生成方法,其特征在于,触发所述三维CG软件的引擎,包括:
利用Python编写脚本,并利用所述脚本触发所述三维CG软件的引擎。


4.根据权利要求3所述的图像训练数据集生成方法,其特征在于,在利用所述引擎及所述虚拟场景生成多张图像之前,还包括:
接收输入的图像生成参数;
相应地,利用所述引擎及所述虚拟场景生成多张图像,包括:
利用所述引擎及所述虚拟场景根据所述图像生成参数生成多张所述图像。


5.根据权利要求1所述的图像训练数据集生成方法,其特征在于,所述三维CG软件为Blender。


6....

【专利技术属性】
技术研发人员:葛晨
申请(专利权)人:浪潮北京电子信息产业有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1