The invention provides a deep learning training method based on robot simulation and physics based sampling, including three stages: the first stage sample by computer simulation on presupposition deep learning training model for training, learning training model of the first stage depth; the second stage, the first stage of deep learning training model and training model of deep learning presupposition model integration, physical samples on the fusion of deep learning training model for training, learning training model of second stage depth; the third stage, the second stage of deep learning training model and training model of presupposition deep learning model fusion, using hybrid robot simulation samples and sample physical mixed samples, training on the fusion depth the training model, learning training model final depth.
【技术实现步骤摘要】
一种基于机器人仿真与物理采样结合的深度学习训练方法
本专利技术涉及一种基于机器人仿真与物理采样结合的深度学习训练方法,属于计算机视觉领域。
技术介绍
在视觉识别技术中,深度学习作为新型的识别方法,对高级特征的提取有独特的优势,在传统图像处理难以实施时,通常利用深度学习的多层网络结构,提取具有复杂纹理的特征。深度学习在识别目标物之前,需要进行线下的训练,训练需要一定的样本,样本数量越多、质量越好,训练的结果就越好。因此样本的数量与质量,决定了深度学习识别的精度。深度学习的训练中,样本采集通常存在以下问题:1.单纯靠人工采集的样本,数量较少,难以满足算法需求,常常出现过拟合、训练不收敛的问题。2.样本采集慢,采集周期长,某些领域甚至需要两三个月收集样本,导致了研发周期加长。3.样本收集的质量差,由于机器人等工业控制领域的样本通常在运动中收集,由于环境变化、故障等因素,导致采集的样本质量不稳定。另外,现有的深度学习模型在整个训练过程中形式不发生变化,只是深度学习参数得到调整,当训练目标物不同的样本时,现有的深度学习模型只能重新训练,造成训练时间加长,模型训练效果不稳定, ...
【技术保护点】
一种基于机器人仿真与物理采样结合的深度学习训练方法,其特征在于包括第一阶段、第二阶段、第三阶段的步骤:第一阶段,利用机器人仿真软件仿真得到计算机仿真样本,采用计算机仿真样本对预设的深度学习训练模型进行训练,得到第一阶段深度学习训练模型;第二阶段,将第一阶段深度学习训练模型与预设深度学习训练模型进行模型融合,采用物理样本对融合后的深度学习训练模型进行训练,得到第二阶段深度学习训练模型;第三阶段,将第二阶段深度学习训练模型与预设深度学习训练模型进行模型融合,采用计算机仿真样本和物理样本混合得到混合样本对融合后的深度学习训练模型进行训练,得到最终的深度学习训练模型,训练过程结束。
【技术特征摘要】
1.一种基于机器人仿真与物理采样结合的深度学习训练方法,其特征在于包括第一阶段、第二阶段、第三阶段的步骤:第一阶段,利用机器人仿真软件仿真得到计算机仿真样本,采用计算机仿真样本对预设的深度学习训练模型进行训练,得到第一阶段深度学习训练模型;第二阶段,将第一阶段深度学习训练模型与预设深度学习训练模型进行模型融合,采用物理样本对融合后的深度学习训练模型进行训练,得到第二阶段深度学习训练模型;第三阶段,将第二阶段深度学习训练模型与预设深度学习训练模型进行模型融合,采用计算机仿真样本和物理样本混合得到混合样本对融合后的深度学习训练模型进行训练,得到最终的深度学习训练模型,训练过程结束。2.根据权利要求1所述的一种基于机器人仿真与物理采样结合的深度学习训练方法,其特征在于每个阶段采用样本对深度学习训练模型进行训练,得到深度学习训练模型的具体过程为:(1.1)、采用深度学习训练模型通过前向传播方法对样本进行计算,得到深度学习训练模型中预设的多个类别的置信度,选取置信度最高的类别作为样本所包含的被识别物所属的类别信息,根据样本所包含的被识别物的类别信息和预设训练参数,采用反向传播方法调整深度学习训练模型参数,完成一个训练回合,之后,重复本步骤,直到训练回合达到预设的a次,减小预设训练参数,转入步骤(1.2);(1.2)、采用步骤(1.1)所获得的深度学习训练模型通过前向传播方法对样本进行计算,得到深度学习训练模型中预设的多个类别的置信度,选取置信度最高的类别作为样本所包含的被识别物所属的类别信息,根据样本所包含的被识别物的类别信息和调整后的预设训练参数,采用反向传播方法调整深度学习训练模型参数,完成一个训练回合,之后,重复本步骤,直到训练回合达到预设的b次,转入下一阶段。3.根据权利要求2所述的一种基于机器人仿真与物理采样结合的深度学习训练方法,其特征在于采用深度学习训练模型通过前向传播方法对样本进行计算,得到深度学习训练模型中预设的多个类别的置信度的具体过程为:对样本图像进行卷积,然后对卷积结果进行池化,最后对池化结果进行激活,得到图像的第一图像特征层;然后,对第一图像特征层进行卷积,然后对卷积结果进行池化,最后对池化结果进行激活,得到图像的第二图像特征层,依次类推,最后得到第N图像特征层,采用Softmax函数做前向计算,得到深度学习训练模型中预设的多个类别的置信度,所述N≥6。4.根据权利要求3所述的一种基于机器人仿真与物理采样结合的深度学习训练方法,其特征在于每个阶段的深度学习训练模型包括各层卷积、池化和激活函数处理:各层卷积的处理结果为t表示第t阶段t=1~3,当i=1时,表示样本图像,否则,表示第i-1图像...
【专利技术属性】
技术研发人员:王燕波,梁斌焱,杨涛,张科,廖俞,王妍,
申请(专利权)人:北京精密机电控制设备研究所,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。