【技术实现步骤摘要】
模型训练系统的特征信息的存储方法、装置及电子设备
[0001]本公开涉及人工智能
,尤其涉及一种模型训练系统的特征信息的存储方法、装置及电子设备。
技术介绍
[0002]相关技术中,常采用GPU集群和参数服务器(ParameterServer,PS)集群来对神经网络模型进行大规模加速训练;其中在对神经网络模型进行训练时,神经网络模型的特征信息会随机存储在PS集群中的各个PS节点上,但在大规模的神经网络模型中,不同特征信息之间的数据维度差异大,PS节点对不同特征信息进行处理时消耗的处理器CPU、带宽、内存等差异大,进而将特征信息随机存储到各个PS节点上进行存储时,会导致不同的PS节点的负载不均衡,容易造成部分PS节点异常,进而使得整个PS集群中的资源浪费,因此如何在存储特征信息时,如何降低PS集群的负载以及均衡PS集群中各PS节点的负载是一个需要考虑的问题。
技术实现思路
[0003]本公开实施例提供一种模型训练系统的特征信息的存储方法、装置及电子设备,用于在神经网络模型训练过程中,降低PS集群存储特征信 ...
【技术保护点】
【技术特征摘要】
1.一种模型训练系统的特征信息的存储方法,其特征在于,包括:根据多个参数服务器节点中各参数服务器节点的负载值,将目标神经网络模型的特征信息存储至所述多个参数服务器节点中至少一个参数服务器节点中;以及将所述特征信息的负载影响值,与所述至少一个参数服务器节点的负载值进行叠加,得到所述至少一个参数服务器节点的更新后的负载值;所述负载影响值基于所述特征信息在所述目标神经网络模型的训练过程中的计算量确定,所述计算量基于所述特征信息的特征类型和所述目标神经网络模型的网络结构确定。2.如权利要求1所述的方法,其特征在于,所述将所述特征信息的负载影响值,与所述至少一个参数服务器节点的负载值进行叠加的步骤之前,还包括:确定所述特征信息的特征类型对应的预设参考值;所述预设参考值基于所述特征类型的参数在所述目标神经网络模型的训练过程中的计算量确定;利用所述预设参考值对所述特征信息进行加权处理,得到所述特征信息的负载影响值。3.如权利要求2所述的方法,其特征在于,所述特征信息包括稀疏特征信息和/或稠密特征信息,所述利用所述预设参考值对所述特征信息进行加权处理,得到所述特征信息的负载影响值的步骤,包括:如果所述特征信息是所述稀疏特征信息,则利用预设的第一参考值对目标特征数量和所述稀疏特征信息的数据量进行处理,得到所述稀疏特征信息的负载影响值,所述目标特征数量根据从所述目标神经网络模型的训练样本中抽取的目标特征的数量确定,所述目标特征用于训练所述稀疏特征信息;所述第一参考值基于所述稀疏特征信息在所述目标神经网络模型的训练过程中的计算量确定;和/或,如果所述特征信息是所述稠密特征信息时,则利用预设的第二参考值对所述稠密特征信息的分片参数的数据量进行处理,得到所述稠密特征信息的负载影响值,所述分片参数是对所述稠密特征信息进行分布式分片处理得到;所述第二参考值基于所述稠密特征信息在所述目标神经网络模型的训练过程中的计算量确定。4.如权利要求3所述的方法,其特征在于,所述目标特征数量包括第一特征数量和第二特征数量,所述第一特征数量是所述抽取的目标特征的数量,所述第二特征数量是将所述抽取的目标特征进行去重处理后所述目标特征的数量;所述利用第一参考值对目标特征数量和所述稀疏特征信息的数据量进行处理,得到所述稀疏特征信息的负载影响值的步骤,包括:利用第一特征权重...
【专利技术属性】
技术研发人员:董星,
申请(专利权)人:北京达佳互联信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。