System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 模型处理方法、装置、计算机设备、存储介质和程序产品制造方法及图纸_技高网

模型处理方法、装置、计算机设备、存储介质和程序产品制造方法及图纸

技术编号:41266618 阅读:3 留言:0更新日期:2024-05-11 09:22
本申请涉及一种模型处理方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:确定输入至待训练的目标模型的当前批次的多张训练图像的第一数量;根据所述当前批次的多张训练图像的第一数量,确定处理所述当前批次的多张训练图像所需的张量计算核心的第二数量;调用所述第二数量个的张量计算核心并行对所述多张训练图像进行处理,以对所述目标模型进行训练。采用本方法能够提升目标模型处理效率。

【技术实现步骤摘要】

本申请涉及计算机,特别是涉及一种模型处理方法、装置、计算机设备、存储介质和计算机程序产品。


技术介绍

1、随着自动驾驶技术的发展,机器学习模型如bevformer(birds eye view +transformer,自动驾驶感知算法)模型在车辆驾驶规划、车辆行为控制等操作中起着重要的作用。

2、目前,在对机器学习模型进行处理的过程中,会对多个批次的样本图像进行处理,以展开机器学习模型的训练,进而可以将训练好的机器学习模型应用于各种实际任务,比如辅助驾驶任务、或障碍物检测任务等。

3、然而,在对任一批次的多张样本图像进行处理的过程中,由于同一批次的样本图像的数量较多,处理时间长,影响了机器学习模型的整体处理效率。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够提升机器学习模型处理效率的模型处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面,本申请提供了一种模型处理方法。所述方法包括:

3、确定输入至待训练的目标模型的当前批次的多张训练图像的第一数量;

4、根据所述当前批次的多张训练图像的第一数量,确定处理所述当前批次的多张训练图像所需的张量计算核心的第二数量;

5、调用所述第二数量个的张量计算核心并行对所述多张训练图像进行处理,以对所述目标模型进行训练。

6、第二方面,本申请还提供了一种模型处理装置。装置包括:

7、确定模块,用于确定输入至待训练的目标模型的当前批次的多张训练图像的第一数量;

8、确定模块,还用于根据所述当前批次的多张训练图像的第一数量,确定处理所述当前批次的多张训练图像所需的张量计算核心的第二数量;

9、处理模块,用于调用所述第二数量个的张量计算核心并行对所述多张训练图像进行处理,以对所述目标模型进行训练。

10、第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述模型处理方法的步骤。

11、第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述模型处理方法的步骤。

12、第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述模型处理方法的步骤。

13、上述模型处理方法、装置、计算机设备、存储介质和计算机程序产品,确定输入至待训练的目标模型的当前批次的多张训练图像的第一数量;进而可以根据第一数量,确定处理当前批次的多张训练图像所需的张量计算核心的第二数量,从而充分调用第二数量个的张量计算核心,来并行对多张训练图像进行处理,以对目标模型进行训练。通过当前批次的多张训练图像的第一数量确定所需的张量计算核心的第二数量,从而可以调用第二数量个的张量计算核心针对多张训练图像展开并行处理,充分利用了gpu的硬件资源,可以有效提升目标模型处理效率。

本文档来自技高网...

【技术保护点】

1.一种模型处理方法,其特征在于,应用于GPU,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述当前批次的多张训练图像的第一数量,确定处理所述当前批次的多张训练图像所需的张量计算核心的第二数量,包括:

3.根据权利要求1所述的方法,其特征在于,所述当前批次的多张训练图像的第一数量,根据图形处理器的显存大小确定。

4.根据权利要求1所述的方法,其特征在于,所述调用所述第二数量个的张量计算核心并行对所述多张训练图像进行处理,以对所述目标模型进行训练,包括:

5.根据权利要求4所述的方法,其特征在于,所述调用所述第二数量个的张量计算核心,并行对所述多张训练图像进行正向处理,得到各训练图像的预测结果,包括:

6.根据权利要求4所述的方法,其特征在于,任一训练图像的目标损失的反向传播的过程中,在任一网络层需要传递的回传梯度包括位置特征梯度的情况下,所述位置特征梯度的回传步骤包括:

7.根据权利要求4所述的方法,其特征在于,任一训练图像的目标损失的反向传播的过程中,在任一网络层需要传递的回传梯度包括图像特征梯度的情况下,所述图像特征梯度的回传步骤包括:

8.根据权利要求1所述的方法,其特征在于,在对训练图像进行处理的过程中,若涉及原子加法算子,则将所述原子加法算子处理的数据、以及计算过程中产生的临时数据的数据格式设置为单精度浮点类型。

9.根据权利要求1至8中任一项所述的方法,其特征在于,所述方法还包括:

10.一种模型处理装置,其特征在于,所述装置包括:

11.根据权利要求10所述的装置,其特征在于,所述确定模块,还用于根据训练图像的图像特征大小,以及所述当前批次的多张训练图像的第一数量,确定处理所述当前批次的多张训练图像所需的张量计算核心的第二数量。

12.根据权利要求10所述的装置,其特征在于,所述处理模块,还用于调用所述第二数量个的张量计算核心,并行对所述多张训练图像进行正向处理,得到各训练图像的预测结果;基于各训练图像的预测结果和标签确定各训练图像的目标损失;调用所述第二数量个的张量计算核心,并行对所述多张训练图像的目标损失进行反向传播,以更新所述待训练的目标模型的模型参数。

13.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述的方法的步骤。

14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。

15.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种模型处理方法,其特征在于,应用于gpu,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述当前批次的多张训练图像的第一数量,确定处理所述当前批次的多张训练图像所需的张量计算核心的第二数量,包括:

3.根据权利要求1所述的方法,其特征在于,所述当前批次的多张训练图像的第一数量,根据图形处理器的显存大小确定。

4.根据权利要求1所述的方法,其特征在于,所述调用所述第二数量个的张量计算核心并行对所述多张训练图像进行处理,以对所述目标模型进行训练,包括:

5.根据权利要求4所述的方法,其特征在于,所述调用所述第二数量个的张量计算核心,并行对所述多张训练图像进行正向处理,得到各训练图像的预测结果,包括:

6.根据权利要求4所述的方法,其特征在于,任一训练图像的目标损失的反向传播的过程中,在任一网络层需要传递的回传梯度包括位置特征梯度的情况下,所述位置特征梯度的回传步骤包括:

7.根据权利要求4所述的方法,其特征在于,任一训练图像的目标损失的反向传播的过程中,在任一网络层需要传递的回传梯度包括图像特征梯度的情况下,所述图像特征梯度的回传步骤包括:

8.根据权利要求1所述的方法,其特征在于,在对训练图像进行处理的过程中,若涉及原子加法算子,则将所述原子加法算子处理的数据、以及计算过程中产生的临...

【专利技术属性】
技术研发人员:程雅慧
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1