模型训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:45092919 阅读:22 留言:0更新日期:2025-04-25 18:29
本公开涉及计算机视觉领域,提出一种模型训练方法、装置、电子设备及存储介质。该方法包括:在训练开始时启动多个显卡负载的多个进程;对于任意一个进程,其作为控制进程时,将控制信息广播至渲染进程,将混叠顺序输出至汇总进程;其作为渲染进程时,根据控制信息的指示驱动对应的子模型完成渲染,将渲染结果输出至汇总进程;其作为汇总进程时,根据混叠顺序混叠渲染结果,根据最终的渲染结果计算各子模型的梯度信息并输出至渲染进程;其作为渲染进程时,根据梯度信息更新对应的子模型的参数。该方法能够降低大模型的训练量、提高大模型的训练效率、降低导致训练无法进行的问题出现的概率。

【技术实现步骤摘要】

本公开涉及计算机视觉领域,尤其涉及一种模型训练方法、装置、电子设备及存储介质


技术介绍

1、三维重建是计算机视觉中的一个重要研究方向,其目标是通过从不同视角捕获的二维图像,在三维空间中重建出三维场景或对象的几何形状,并支持一定的采样位置和采样视角下对三维空间的采样。这个过程涉及到图像处理、机器学习、优化算法等多个领域的知识,并且在虚拟现实、增强现实、无人驾驶等多个应用场景中有重要作用。

2、由于大模型在计算机视觉领域具备出色表现,因此使用大模型成为三维重建的可选方案之一。大模型指的是大规模神经网络模型,在训练时通常需要使用分布式计算、数据并行等技术减少训练时间并控制训练资源消耗。现有技术在训练大模型时,存在训练量大、效率低、容易出现导致训练无法进行的问题的缺点。如何降低大模型的训练量、提高大模型的训练效率、降低导致训练无法进行的问题出现的概率,成为本领域亟待解决的技术问题。


技术实现思路

1、有鉴于此,本公开提出了一种模型训练方法、装置、电子设备及存储介质,本公开的模型训练方法能够降低大模型的训本文档来自技高网...

【技术保护点】

1.一种模型训练方法,其特征在于,所述方法用于训练大模型,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述大模型用于对三维空间进行采样,在所述大模型的第一次训练开始前,或者,在所述大模型出现变化后,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述大模型是高斯泼溅模型,所述将所述三维空间分割为多个子空间,包括:

5.根据权利要求4所述的方法,其特征在于,所述第一预设条件包括:

6.根据权利要求1所述的方法,其特征在于,所述根据所述最终的渲染结...

【技术特征摘要】

1.一种模型训练方法,其特征在于,所述方法用于训练大模型,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述大模型用于对三维空间进行采样,在所述大模型的第一次训练开始前,或者,在所述大模型出现变化后,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述大模型是高斯泼溅模型,所述将所述三维空间分割为多个子空间,包括:

5.根据权利要求4所述的方法,其特征在于,所述第一预设条件包括:

6.根据权利要求1所述的方法,其特征在于,所述根据所述最终的渲染结果计算各子模型的梯度信息并输出至各子模型对应的渲染进程,包括:

7.根据权利要求3...

【专利技术属性】
技术研发人员:请求不公布姓名
申请(专利权)人:摩尔线程智能科技北京股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1