【技术实现步骤摘要】
模型训练方法和装置、预测方法和装置
本申请涉及计算机
,尤其涉及人工智能、深度学习、图像处理、自动驾驶领域。
技术介绍
现有基于监督的深度信息估计的方案,以彩色图像作为输入,通过机器学习,如卷积神经网络等方式,估计彩色图像的深度信息。该方案在训练过程中,通过激光雷达或其它深度传感器采集真实的深度信息来作为监督信号,但高精度且密集的深度信息往往难以获得,导致训练受限。
技术实现思路
本申请提供了一种模型训练方法和装置、预测方法和装置。第一方面,本申请提供了一种模型训练方法,包括:将样本图像中第一样本图像输入深度信息预测模型,得到第一样本图像的深度信息;基于样本图像中第二样本图像以及第一样本图像,得到图像间姿态信息;至少根据图像间姿态信息和深度信息,得到第一样本图像对应的投影图像;确定计算第二样本图像与投影图像的相似度的函数,得到损失函数,利用损失函数训练深度信息预测模型。第二方面,本申请提供了一种预测方法,包括:获取待预测图像;将待预测图像输入深度信息预测模型,得到深度信息预测模型输出的待预测图像的深度信息;其中,深度信息预测模型采用本申请所提供的模型训练方法训练所得。第三方面,本申请提供了一种模型训练装置,包括:将样本图像中第一样本图像输入深度信息预测模型,得到第一样本图像的深度信息;基于样本图像中第二样本图像以及第一样本图像,得到图像间姿态信息;至少根据图像间姿态信息和深度信息,得到第一 ...
【技术保护点】
1.一种模型训练方法,包括:/n将样本图像中第一样本图像输入深度信息预测模型,得到所述第一样本图像的深度信息;/n基于所述样本图像中第二样本图像以及所述第一样本图像,得到图像间姿态信息;/n至少根据所述图像间姿态信息和所述深度信息,得到所述第一样本图像对应的投影图像;/n确定计算所述第二样本图像与所述投影图像的相似度的函数,得到损失函数,利用所述损失函数训练所述深度信息预测模型。/n
【技术特征摘要】
1.一种模型训练方法,包括:
将样本图像中第一样本图像输入深度信息预测模型,得到所述第一样本图像的深度信息;
基于所述样本图像中第二样本图像以及所述第一样本图像,得到图像间姿态信息;
至少根据所述图像间姿态信息和所述深度信息,得到所述第一样本图像对应的投影图像;
确定计算所述第二样本图像与所述投影图像的相似度的函数,得到损失函数,利用所述损失函数训练所述深度信息预测模型。
2.根据权利要求1所述的方法,其中,所述得到所述第一样本图像的深度信息,包括:
对第一样本图像进行尺寸处理,得到与第一样本图像的尺寸不同的第一图像;
对所述第一图像进行特征提取,得到图像特征;
根据所述图像特征,确定所述第一样本图像的深度信息。
3.根据权利要求1或2所述的方法,其中,所述得到所述第一样本图像的深度信息,包括:
利用所述深度信息预测模型中的卷积层对第一样本图像进行特征提取,得到卷积特征;
根据所述卷积特征,确定所述第一样本图像的深度信息。
4.根据权利要求1所述的方法,其中,所述得到所述第一样本图像的深度信息,包括:
获取所述第一样本图像的图像特征和卷积特征,所述图像特征是对第一图像进行特征提取后得到的,所述第一图像为与所述第一样本图像的尺寸不同的图像,所述卷积特征是利用所述深度信息预测模型中卷积层对所述第一样本图像进行特征提取后得到的;
根据所述图像特征和所述卷积特征,确定所述第一样本图像的深度信息。
5.根据权利要求1或4所述的方法,其中,所述基于所述样本图像中第二样本图像以及所述第一样本图像,得到图像间姿态信息,包括:
对所述第二样本图像和所述第一样本图像进行特征提取;
对提取得到的所述第二样本图像和所述第一样本图像的特征进行回归处理,得到图像间姿态信息。
6.根据权利要求1或4所述的方法,其中,
所述至少根据所述图像间姿态信息和所述深度信息,得到所述第一样本图像对应的投影图像,包括:
获取所述第一样本图像对应的第一采集参数以及所述第二样本图像对应的第二采集参数;
根据所述第一样本图像的深度信息和所述第一采集参数,确定所述第一样本图像的第一点云数据;
根据所述图像间姿态信息,将所述第一点云数据转换为第二点云数据;
根据所述第二采集参数对所述第二点云数据进行投影,得到所述投影图像。
7.一种预测方法,包括:
获取待预测图像;
将所述待预测图像输入深度信息预测模型,得到所述深度信息预测模型输出的所述待预测图像的深度信息;
其中,所述深度信息预测模型采用权利要求1-6任一项所述的模型训练方法训练所得。
8.一种模型训练装置,包括:
深度信息获得模块,用于将样本图像中第一样本图像输入深度信息预测模型,得到所述第一样本图像的深度信息;
图像间姿态信息获得模块,用于基于所述样本图像中第二样本图像以及所述第一样本图像,得到图像间姿态信息;
投影图像获得模块,用于至少根据所述图像间姿态信息和所述深度信息,得到所述第一样本图像对应的投影图像;
损失函数获得模...
【专利技术属性】
技术研发人员:宋希彬,周定富,方进,张良俊,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。