The embodiment of the present invention provides a method and device for generating training data. The method includes: generating training data sets according to preset control parameters, and generating training data sets including multiple training data; training the target model with the generated training data sets; testing the trained target model with the test data sets to determine the correct rate of the generated training data sets; and according to the correct rate of the generated training data sets and corresponding training data sets. The target accuracy is adjusted by adjusting the preset control parameters, and the target accuracy is the correct rate corresponding to the real training data set. The method of the embodiment of the present invention reduces the difference between the generated training data and the real training data, and can meet the needs of model training.
【技术实现步骤摘要】
训练数据的生成方法及装置
本专利技术实施例涉及计算机
,尤其涉及一种训练数据的生成方法及装置。
技术介绍
随着人工智能的不断发展,越来越多基于人工智能的应用投入使用,为人们的生活带来了极大的便利,例如无人超市、无人车、无人餐厅、无人机等。基于人工智能的应用在投入使用之前,需要使用大量已标注的训练数据完成对应用模型的训练。通过人工获取及标注训练数据,远远不能满足模型训练的需求,且人工获取及标注成本高,场景覆盖不足。为了满足模型训练的需求,目前可以通过计算机模拟的方式生成训练数据,然而采用该方式生成的训练数据与真实的训练数据差别较大,训练出的应用模型精度较差,不能满足实际应用需求。
技术实现思路
本专利技术实施例提供一种训练数据的生成方法及装置,用以解决现有技术生成的训练数据与真实的训练数据差别较大,不能满足模型训练需求的问题。第一方面,本专利技术实施例提供一种训练数据的生成方法,包括:根据预设的控制参数,生成训练数据集,生成的训练数据集包括多个训练数据;采用生成的训练数据集对目标模型进行训练;采用测试数据集对训练好的目标模型进行测试,确定生成的训练数据集对应的正确 ...
【技术保护点】
1.一种训练数据的生成方法,其特征在于,包括:根据预设的控制参数,生成训练数据集,所述生成的训练数据集包括多个训练数据;采用所述生成的训练数据集对目标模型进行训练;采用测试数据集对训练好的所述目标模型进行测试,确定所述生成的训练数据集对应的正确率;根据所述生成的训练数据集对应的正确率和目标正确率,调整所述预设的控制参数,所述目标正确率为真实训练数据集对应的正确率。
【技术特征摘要】
1.一种训练数据的生成方法,其特征在于,包括:根据预设的控制参数,生成训练数据集,所述生成的训练数据集包括多个训练数据;采用所述生成的训练数据集对目标模型进行训练;采用测试数据集对训练好的所述目标模型进行测试,确定所述生成的训练数据集对应的正确率;根据所述生成的训练数据集对应的正确率和目标正确率,调整所述预设的控制参数,所述目标正确率为真实训练数据集对应的正确率。2.根据权利要求1所述的方法,其特征在于,所述根据所述生成的训练数据集对应的正确率和目标正确率,调整所述预设的控制参数包括:根据所述生成的训练数据集对应的正确率和目标正确率的差值,调整所述预设的控制参数,直至根据调整后的控制参数生成的训练数据集对应的正确率与所述目标正确率之间的差值小于预设阈值。3.根据权利要求1所述的方法,其特征在于,所述根据所述生成的训练数据集对应的正确率和目标正确率,调整所述预设的控制参数包括:根据所述生成的训练数据集对应的正确率和所述目标正确率,确定损失函数;根据所述损失函数,基于对抗网络对所述预设的控制参数进行调整。4.根据权利要求1所述的方法,其特征在于,所述根据预设的控制参数,生成训练数据集,包括:根据预设的控制参数,构建虚拟的三维立体场景;将设置了标签的物体模型置于所述三维立体场景中;通过虚拟摄像机获取所述物体模型在所述三维立体场景中的图像数据;将获取到的图像数据和所述标签作为训练数据集。5.根据权利要求4所述的方法,其特征在于,所述通过虚拟摄像机获取所述物体模型在所述三维立体场景中的图像数据包括:设置所述虚拟摄像机在所述三维立体场景中的拍摄轨迹;当所述虚拟摄像机沿所述拍摄轨迹运行时,获取位于不同观察视角的所述物体模型的图像数据。6.根据权利要求4或5所述的方法,其特征在于,所述预设的控制参数包括以下参数中的一种或者多种:全局光照属性参数、直接光照属性参数、模拟物体表面材质属性参数和相机镜头属性参数。7.一种训练数据的生成装置,其特征在于,包括:生成模块,用于根据预设的控制参数,生成训练数据集,所述生成的训练数据...
【专利技术属性】
技术研发人员:魏楠,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。