深度学习网络模型的配置方法、装置及存储介质制造方法及图纸

技术编号:26305027 阅读:42 留言:0更新日期:2020-11-10 20:02
本申请公开了一种深度学习网络模型的配置方法、装置及计算机存储介质,属于深度学习领域。本申请实施例提供的配置方法首先可以获取当前设备的硬件信息,之后根据当前设备的硬件信息,确定深度学习网络模型包括的多层神经网络的输入配置信息,进而根据该深度学习网络模型包括的多层神经网络的输入配置信息和当前设备的硬件信息来为该深度学习网络分配运算资源。这样,即使设备的硬件条件发生了变化,也可以通过本申请提供的配置方法,根据当前设备的硬件信息来为该深度学习网络模型进行配置,也即,本申请提供的配置方法具备通用性。

【技术实现步骤摘要】
深度学习网络模型的配置方法、装置及存储介质
本申请涉及深度学习
,特别涉及一种深度学习网络模型的配置方法、装置及存储介质。
技术介绍
目前,当在设备上运行深度学习网络模型时,通常需要根据当前设备的硬件信息确定与当前设备的硬件条件相匹配的配置方法,进而根据确定的配置方法对深度学习网络模型进行配置,以便该深度学习网络模型可以在配置后得到的配置信息的基础上进行运算。然而,由于不同的设备往往具备不同的硬件条件,因此,当在其他设备上运行该深度学习网络模型时,由于硬件条件发生了变化,因此,根据当前设备的硬件信息确定的配置方法往往不再适用于其他设备。这就导致每当更换设备时,均需要针对不同设备的硬件信息重新确定配置方法。由此可见,当前对深度学习网络模型进行配置的方法不具备通用性,可移植性较差。
技术实现思路
本申请实施例提供了一种深度学习网络模型的配置方法、装置及计算机存储介质,可以用于解决相关技术中对深度学习网络模型进行配置的方法不具备通用性、可移植性较差的问题。所述技术方案如下:一方面,提供了一种深度学习网络模型的本文档来自技高网...

【技术保护点】
1.一种深度学习网络模型的配置方法,其特征在于,所述方法包括:/n获取当前设备的硬件信息;/n根据所述当前设备的硬件信息,确定深度学习网络模型包括的多层神经网络的输入配置信息,所述输入配置信息包括数据转换标识和运算参数,所述数据转换标识用于指示是否对输入至神经网络的特征数据进行数据格式转换;/n根据所述当前设备的硬件信息和所述深度学习网络模型包括的多层神经网络的输入配置信息,为所述深度学习网络模型分配运算资源。/n

【技术特征摘要】
1.一种深度学习网络模型的配置方法,其特征在于,所述方法包括:
获取当前设备的硬件信息;
根据所述当前设备的硬件信息,确定深度学习网络模型包括的多层神经网络的输入配置信息,所述输入配置信息包括数据转换标识和运算参数,所述数据转换标识用于指示是否对输入至神经网络的特征数据进行数据格式转换;
根据所述当前设备的硬件信息和所述深度学习网络模型包括的多层神经网络的输入配置信息,为所述深度学习网络模型分配运算资源。


2.根据权利要求1所述的方法,其特征在于,所述根据所述当前设备的硬件信息,确定所述深度学习网络模型包括的多层神经网络的输入配置信息,包括:
根据所述当前设备的硬件信息确定所述当前设备的通道对齐数;
获取所述深度学习网络模型包括的多层神经网络中的每一层神经网络的输入数据通道数;
根据所述当前设备的通道对齐数和每一层神经网络的输入数据通道数,确定每一层神经网络的数据转换标识;
根据每一层神经网络的数据转换标识和每一层神经网络的权重数据,确定每一层神经网络的输入配置信息。


3.根据权利要求2所述的方法,其特征在于,所述根据所述当前设备的通道对齐数和每一层神经网络的输入数据通道数,确定每一层神经网络的数据转换标识,包括:
若所述当前设备的通道对齐数与目标层神经网络的输入数据通道数相同,则确定所述目标层神经网络的数据转换标识为第一标识,所述目标层神经网络是指所述深度学习网络模型包括的多层神经网络中的任一层神经网络,所述第一标识用于指示不对输入所述目标层神经网络的特征数据进行数据格式转换;
所述根据每一层神经网络的数据转换标识和权重数据,确定所述深度学习网络模型的每一层神经网络的输入配置信息,包括:
将所述目标层神经网络的数据转换标识和权重数据作为所述目标层神经网络标识的输入配置信息,所述输入配置信息包括的运算参数是指所述权重数据。


4.根据权利要求2所述的方法,其特征在于,所述根据所述当前设备的通道对齐数和每一层神经网络的输入数据通道数,确定每一层神经网络的数据转换标识,包括:
若所述当前设备的通道对齐数与目标层神经网络的输入数据通道数不同,则确定所述目标层神经网络的数据转换标识为第二标识,所述目标层神经网络是指所述深度学习网络模型包括的多层神经网络中的任一层神经网络,所述第二标识用于指示对输入所述目标层神经网络的特征数据进行数据格式转换;
所述根据每一层神经网络的数据转换标识和权重数据,确定所述深度学习网络模型的每一层神经网络的输入配置信息,包括:
根据所述通道对齐数对所述目标层神经网络的权重数据进行数据格式转换;
将转换后的权重数据和所述目标层神经网络的数据转换标识作为所述目标层神经网络的输入配置信息,所述输入配置信息包括的运算参数是指转换后的权重数据。


5.根据权利要求2-4任一所述的方法,其特征在于,所述方法还包括:
若目标层神经网络不为Reshape层、全连接层、批归一化BN层和scale层中的任一个,或者,若所述目标层神经网络为连接层且所述目标层神经网络的下一层神经网络不为Reshape层,则执行根据所述当前设备的通道对齐数和每一层神经网络的输入数据通道数,确定每一层神经网络的数据转换标识的步骤。


6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
若所述目标层神经网络为Reshape层、全连接层、BN层和scale层中的任一个,或者,若所述目标层神经网络为连接层且所述目标层神经网络的下一层神经网络为Reshape层,则确定所述目标层神经网络的数据转换标识为第一标识;
将所述目标层神经网络的数据转换标识和权重数据作为所述目标层神经网络标识的输入配置信息,所述输入配置信息包括的运算参数是指所述权重数据。


7.根据权利要求1-6任一所述的方法,其特征在于,所述根据所述当前设备的硬件信息和所述深度学习网络模型包括的多层神经网络的输入配置信息,为所述深度学习网络模型分配运算资源,包括:
根据所述当前设备的硬件信息,确定所述当前设备的运算硬件的类型标识,所述运算硬件是指用于实现所述深度学习网络模型中每一层神经网络的数据运算的硬件;
根据所述当前设备的运算硬件的类型标识和所述深度学习网络模型包括的多层神经网络的输入配置信息,为所述深度学习网络模型分配运算资源。


8.根据权利要求7所述的方法,其特征在于,所述根据所述当前设备的运算硬件的类型标识和所述深度学习网络模型包括的多层神经网络的输入配置信息,为所述深度学习网络模型分配运算资源,包括:
当所述当前设备的运算硬件的类型标识所标识的运算硬件为图形处理器GPU时,根据所述深度学习网络模型包括的多层神经网络的输入配置信息为所述深度学习网络模型创建多个CPU线程,所述多个CPU线程中的每个CPU线程中包括至少三个GPU任务,所述至少三个GPU任务用于基于所述深度学习网络模型包括的多层神经网络的输入配置信息实现所述深度学习网络模型的数据运算;
为每个CPU线程分配对应的流队列,其中,每个CPU线程对应的流队列包括相应CPU线程中的至少三个GPU任务,且不同CPU线程对应的流队列不同。


9.根据权利要求8所述的方法,其特征在于,所述GPU包括多个GPU线程块和多个共享存储器SM,所述多个GPU线程块中的每个线程块包括多个GPU线程;
所述为每个CPU线程分配对应的流队列之后,还包括:
根据执行每个GPU任务所需的线程数和每个GPU线程块包括的多个GPU线程的数量,为每个GPU任务分配对应的GPU线程块;
...

【专利技术属性】
技术研发人员:屠震元叶挺群
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1