【技术实现步骤摘要】
神经网络模型的训练方法及装置、非易失性存储介质
[0001]本申请涉及信息
,具体而言,涉及一种神经网络模型的训练方法及装置
、
非易失性存储介质
。
技术介绍
[0002]图像处理单元
(Graphics Processing Unit
,
GPU)
虚拟化技术是一种将一个物理
GPU
划分为多个虚拟
GPU
,并将不同的任务分配到不同的虚拟
GPU
上,以实现合理利用
GPU
资源的技术
。GPU
虚拟化技术在云计算
、
大数据分析
、
人工智能等领域具有广泛的应用前景,因此在相关领域中,
GPU
虚拟化资源分配方式也受到了广泛的关注
。
[0003]相关
GPU
虚拟化资源分配方法主要包括静态资源分配和动态资源分配两种方式
。
其中,静态资源分配是将物理
GPU
划分为 ...
【技术保护点】
【技术特征摘要】
1.
一种神经网络模型的训练方法,其特征在于,包括:获取样本数据集,其中,所述样本数据集为同一图像处理单元集群内图像处理单元资源池中图像处理单元处理的多个历史任务;确定运行于所述图像处理单元的目标神经网络模型的计算量和访存量,并确定所述多个历史任务中每个历史任务对应的资源配置参数,其中,所述目标神经网络模型为处理所述多个历史任务中的每个历史任务的神经网络模型;根据所述计算量
、
所述访存量和所述资源配置参数,确定所述样本数据集对应的多元特征函数;根据所述样本数据集和所述多元特征函数,对预设决策生成网络模型进行训练,得到目标决策生成网络模型,其中,所述目标决策生成网络模型用于确定图像处理单元虚拟化离散资源的性能值
。2.
根据权利要求1所述的方法,其特征在于,确定运行于所述图像处理单元的目标神经网络模型的计算量和访存量,包括:分别根据所述目标神经网络模型中每个卷积核输出特征图的边长
、
每个卷积核的边长
、
每个卷积核的输入通道数以及每个卷积核的输出通道数,确定所述目标神经网络模型的所述计算量和所述访存量
。3.
根据权利要求1所述的方法,其特征在于,确定所述多个历史任务中每个历史任务对应的资源配置参数,包括:根据所述每个历史任务占用的图像处理单元的显存和算力,确定所述每个历史任务对应的所述资源配置参数
。4.
根据权利要求1所述的方法,其特征在于,根据所述计算量
、
所述访存量和所述资源配置参数,确定多元特征函数,包括:确定所述计算量对应的第一权重,所述访存量对应的第二权重,以及所述资源配置参数对应的第三权重;根据所述第一权重
、
所述第二权重
、
所述第三权重,对所述计算量
、
所述访存量和所述资源配置参数进行加权求和,确定所述多元特征函数
。5.
根据权利要求1所述的方法,其特征在于,根据所述样本数据集和所述多元特征函数,对预设决策生成网络模型进行训练,得到目标决策生成网络模型,包括:将第一预设数量的样本数据集确定为训练数据集;通过所述预设决策生成网络模型处理所述训练数据集和所述多元特征函数,得到目标决策树,其中,所述目标决策树用于输出第一类特征向量和第二类特征向量,其中,所述第一类特征向量用于表征任务的性能与所述目标神经网络模型的所述计算量...
【专利技术属性】
技术研发人员:肖潇,徐玉清,康华文,袁守正,廖晓雪,满雅文,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。