【技术实现步骤摘要】
一种图像处理方法及装置
[0001]本申请是申请日为2019年04月28日的中国专利申请号201910351289.4、专利技术名称为“一种图像处理方法及装置”的分案申请。
[0002]本申请涉及机器人技术,尤其涉及一种图像处理方法及装置。
技术介绍
[0003]机器人学习的研究主要分为监督学习和强化学习两个方向,其中监督学习又有模仿学习和自监督学习等细分方向。模仿学习方法通过收集专家的示教信息来训练网络模型,缺点是需要大量专家示教信息,且通常假设环境是已知和有限的,对于现实中开放而复杂的场景效果不好;自监督学习则是通过机器人试错实验来采集标注数据,缺点试错实验成功率低,采集数据非常低效,而且在真实环境中试错会存在安全风险。强化学习方法通过机器人大量的探索来学会完成指定的任务,缺点是需要的探索次数非常多,在现实中几乎不可能完成。
[0004]现有机器人学习过程中是直接使用彩色图像作为网络模型输入,通过生成对抗网络(Generative Adversarial Networks,GAN)模型来学习到一个能对输入 ...
【技术保护点】
【技术特征摘要】
1.一种图像处理方法,其特征在于,所述方法包括:获取训练样本集,所述训练样本集包括至少一个彩色样本图像,以及至少一个与所述彩色样本图像对应的深度样本图像;将所述训练样本集输入图像处理模型进行处理,所述图像处理模型包括彩色图像处理模型以及深度图像处理模型,所述彩色图像处理模型用于对所述彩色样本图像进行处理得到彩色重构图像,所述深度图像处理模型用于对所述深度图像进行处理得到深度重构图像;将所述彩色样本图像输入至所述彩色图像处理模型的第一编码模块中,输出编码后的第一彩色样本图像;将所述深度样本图像输入至所述深度图像处理模型的第二编码模块中,输出编码后的第一深度样本图像;利用所述编码后的第一彩色样本图像和所述编码后的第一深度样本图像,计算得到第二损失参数;将所述第二损失参数作为第一损失参数;或者,基于所述编码后的第一彩色样本图像和所述彩色重构图像,确定第三损失参数;基于所述第二损失参数和所述第三损失参数,确定所述第一损失参数;又或者,基于所述编码后的第一彩色样本图像和所述彩色重构图像,确定第三损失参数;基于所述编码后的第一深度样本图像和所述深度重构图像,确定第四损失参数;基于所述第二损失参数和所述第四损失参数,确定所述第一损失参数;基于所述第一损失参数调整所述彩色图像处理模型,得到训练后的彩色图像处理模型。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:基于所述第一损失参数调整所述深度图像处理模型,得到训练后的深度图像处理模型。3.根据权利要求1所述的方法,其特征在于,所述训练样本集还包括:至少一个与所述彩色样本图像对应的机器人的状态标签,所述方法还包括:将所述彩色样本图像输入至所述训练后的彩色图像处理模型的第一编码模块,输出编码后的第二彩色样本图像;基于所述编码后的第二彩色样本图像以及所述机器人的状态标签,确定控制模型的第五损失参数;基于所述第五损失参数调整控制模型,得到训练后的控制模型;或者,所述方法还包括:将所述彩色样本图像输入至所述训练后的彩色图像处理模型的第一编码模块,输出编码后的第二彩色样本图像;将所述深度样本图像输入至所述训练后的深度图像处理模型的第二编码模块,输出编码后的第二深度样本图像;基于所述编码后的第二彩色样本图像和所述编码后的第二深度样本图像,以及所述机器人的状态标签,确定控制模型的第五损失参数;基于所述第五损失参数调整控制模型,得到训练后的控制模型。4.根据权利要求3所述的方法,其特征在于,所述基于所述编码后的第二彩色样本图像
以及所述机器人的状态标签,确定控制模型的第五损失参数,包括:将所述编码后的第二彩色样本图像输入至所述控制模型,得到所述机器人的预测状态信息;基于所述机器人的预测状态信息和所述机器人状态标签,确定所述第五损失参数。5.根据权利要求4所述的方法,其特征在于,所述控制模型包括第一控制模型和第二控制模型,所述将所述编码后的第二彩色样本图像输入至所述控制模型,得到所述机器人的预测状态信息,包括:将编码后的第二彩色样本图像作为所述第二控制模型的输入信息,将所述第二控制模型的输出信息作为所述第一控制模型的输入信息,输出所述预测状态信息。6.根...
【专利技术属性】
技术研发人员:吴华栋,张展鹏,成慧,杨凯,
申请(专利权)人:深圳市商汤科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。