本公开提供了一种数据处理方法,包括:接收用户输入的训练逻辑数据,其中,所述训练逻辑数据能够用于构建初始逻辑模型;基于所述训练逻辑数据构建多个初始逻辑模型;控制所述多个初始逻辑模型基于样本数据进行训练,得到多个训练后的初始逻辑模型;以及根据所述多个训练后的初始逻辑模型确定目标逻辑模型。
【技术实现步骤摘要】
数据处理方法、逻辑模型系统以及数据处理系统
本公开涉及一种数据处理方法、逻辑模型系统以及数据处理系统。
技术介绍
随着电子技术的快速发展,通常需要处理大量的数据。例如在模型训练过程中,数据量非常大,因此,为了加速模型训练的速度,通常通过并行计算来加速模型训练的速度,例如通过分布式并行计算的方式加速训练速度。但是,现有技术在并行训练模型时,用户不仅需要构建训练模型,还需要了解较多的分布式并行计算的逻辑,使得用户的开发成本较高,使用过程繁琐。因此,如何优化并行计算的操作过程,降低用户的开发成本,提升使用并行方式进行计算的效率和灵活性成为亟需解决的问题。
技术实现思路
本公开的一个方面提供了一种数据处理方法,包括:接收用户输入的训练逻辑数据,其中,所述训练逻辑数据能够用于构建初始逻辑模型,基于所述训练逻辑数据构建多个初始逻辑模型,控制所述多个初始逻辑模型基于样本数据进行训练,得到多个训练后的初始逻辑模型,根据所述多个训练后的初始逻辑模型确定目标逻辑模型。可选地,上述根据所述多个训练后的初始逻辑模型确定目标逻辑模型,包括:获取所述多个训练后的初始逻辑模型的模型梯度,基于所述模型梯度更新所述初始逻辑模型的模型参数,得到目标逻辑模型。可选地,上述控制所述多个初始逻辑模型基于样本数据进行训练,包括:控制所述多个初始逻辑模型中的每个初始逻辑模型从所述样本数据中获取子样本数据,控制所述每个初始逻辑模型基于对应的子样本数据进行训练。可选地,上述训练逻辑数据包括:损失函数信息以及梯度信息,所述基于所述训练逻辑数据构建多个初始逻辑模型,包括:基于所述损失函数信息配置所述初始逻辑模型的模型参数,基于所述模型参数以及所述梯度信息构建逻辑模型计算图以及梯度计算图。可选地,上述方法还包括:接收用户输入的控制信息,所述控制信息能够用于生成控制指令,所述控制指令用于控制所述初始逻辑模型的训练。可选地,上述控制所述多个初始逻辑模型基于样本数据进行训练,包括根据预设循环次数循环执行:控制所述多个初始逻辑模型中的每个初始逻辑模型从所述样本数据中获取子样本数据,控制所述多个初始逻辑模型基于相应的子样本数据分别进行训练,得到与所述多个初始逻辑模型的对应的多组模型梯度,基于所述多组模型梯度更新所述初始逻辑模型的模型参数。可选地,上述方法用于电子设备,所述电子设备包括参数服务器和多个计算节点,所述计算节点包括多个计算单元,所述每个计算单元包括所述初始逻辑模型,所述方法包括:控制每个计算单元从所述样本数据中获取子样本数据,并基于子样本数据训练对应的初始逻辑模型,得到所述对应的初始逻辑模型的模型梯度,将每个计算单元训练得到的模型梯度上传到所述计算单元对应的计算节点,控制所述计算节点处理接收到的模型梯度,并将处理后的模型梯度上传至所述参数服务器,控制所述参数服务器基于接收到的处理后的模型梯度更新所述初始逻辑模型的模型参数,将所述更新后的模型参数发送至所述每个计算单元,控制每个计算单元基于接收到的更新后的模型参数更新对应的初始逻辑模型。可选地,上述方法,其中,属于一个计算节点的多个计算单元包括一个主计算单元和至少一个副计算单元,所述基于所述损失函数信息配置所述初始逻辑模型的模型参数,包括:控制所述主计算单元从所述训练逻辑数据中提取所述损失函数信息,控制所述主计算单元根据所述损失函数信息配置所述模型参数,控制所述副计算单元通过访问所述主计算单元复制配置的模型参数。可选地,上述基于所述模型参数以及所述梯度信息构建模型计算图以及梯度计算图,包括:控制所述主计算单元和所述副计算单元从所述训练逻辑数据中提取所述梯度信息,控制所述主计算单元和所述副计算单元基于所述配置的模型参数以及所述梯度信息构建模型计算图以及梯度计算图。本公开的另一个方面提供了一种逻辑模型系统,包括:多个初始逻辑模型,所述多个初始逻辑模型为基于用户输入的训练逻辑数据构建而成的逻辑模型,其中,所述多个初始逻辑模型能够用于执行:基于样本数据进行训练,得到多个训练后的初始逻辑模型,其中,所述多个训练后的初始逻辑模型能够用于确定目标逻辑模型。可选地,上述逻辑模型系统能够执行:获取所述多个训练后的初始逻辑模型的模型梯度,基于所述模型梯度更新所述初始逻辑模型的模型参数,得到目标逻辑模型。可选地,上述逻辑模型系统能够执行:控制所述多个初始逻辑模型中的每个初始逻辑模型从所述样本数据中获取子样本数据,控制所述每个初始逻辑模型基于对应的子样本数据进行训练。可选地,上述训练逻辑数据包括:损失函数信息以及梯度信息,所述逻辑模型系统能够执行,包括:基于所述损失函数信息配置所述初始逻辑模型的模型参数,基于所述模型参数以及所述梯度信息构建逻辑模型计算图以及梯度计算图。可选地,上述逻辑模型系统能够执行:接收用户输入的控制信息,所述控制信息能够用于生成控制指令,所述控制指令用于控制所述初始逻辑模型的训练。可选地,上述逻辑模型系统能够根据预设循环次数循环执行:控制所述多个初始逻辑模型中的每个初始逻辑模型从所述样本数据中获取子样本数据,控制所述多个初始逻辑模型基于相应的子样本数据分别进行训练,得到与所述多个初始逻辑模型的对应的多组模型梯度,基于所述多组模型梯度更新所述初始逻辑模型的模型参数。可选地,上述逻辑模型系统能够用于电子设备,所述电子设备包括参数服务器和多个计算节点,所述计算节点包括多个计算单元,所述每个计算单元包括所述初始逻辑模型,所述逻辑模型系统能够执行:控制每个计算单元从所述样本数据中获取子样本数据,并基于子样本数据训练对应的初始逻辑模型,得到所述对应的初始逻辑模型的模型梯度,将每个计算单元训练得到的模型梯度上传到所述计算单元对应的计算节点,控制所述计算节点处理接收到的模型梯度,并将处理后的模型梯度上传至所述参数服务器,控制所述参数服务器基于接收到的处理后的模型梯度更新所述初始逻辑模型的模型参数,将所述更新后的模型参数发送至所述每个计算单元,控制每个计算单元基于接收到的更新后的模型参数更新对应的初始逻辑模型。可选地,其中,属于一个计算节点的多个计算单元包括一个主计算单元和至少一个副计算单元,上述逻辑模型系统能够执行:控制所述主计算单元从所述训练逻辑数据中提取所述损失函数信息,控制所述主计算单元根据所述损失函数信息配置所述模型参数,控制所述副计算单元通过访问所述主计算单元复制配置的模型参数。可选地,上述逻辑模型系统能够执行:控制所述主计算单元和所述副计算单元从所述训练逻辑数据中提取所述梯度信息,控制所述主计算单元和所述副计算单元基于所述配置的模型参数以及所述梯度信息构建模型计算图以及梯度计算图。本公开的另一个方面提供了一种数据处理系统,包括:第一接收模块、构建模块、训练模块以及确定模块。其中,第一接收模块接收用户输入的训练逻辑数据,其中,所述训练逻辑数据能够用于构建初始逻辑模型,构建模块基于所述训练逻辑数据构建多个初始逻辑模型,训练模块控制所述多个初始逻辑模型基于样本数据进行训练,得到多个训练后的初始逻辑模型,确定模块根据所述多个训练后的初始逻辑模型确定目标逻辑模型。可选地,上述根据所述多个训练后的初始逻辑模型确定目标逻辑模型,包括:获取所述多个训练后的初始逻辑模型的模型梯度,基于所述模型梯度更新所述初始逻辑模型的模型本文档来自技高网...
【技术保护点】
1.一种数据处理方法,包括:接收用户输入的训练逻辑数据,其中,所述训练逻辑数据能够用于构建初始逻辑模型;基于所述训练逻辑数据构建多个初始逻辑模型;控制所述多个初始逻辑模型基于样本数据进行训练,得到多个训练后的初始逻辑模型;以及根据所述多个训练后的初始逻辑模型确定目标逻辑模型。
【技术特征摘要】
1.一种数据处理方法,包括:接收用户输入的训练逻辑数据,其中,所述训练逻辑数据能够用于构建初始逻辑模型;基于所述训练逻辑数据构建多个初始逻辑模型;控制所述多个初始逻辑模型基于样本数据进行训练,得到多个训练后的初始逻辑模型;以及根据所述多个训练后的初始逻辑模型确定目标逻辑模型。2.根据权利要求1所述的方法,其中,所述根据所述多个训练后的初始逻辑模型确定目标逻辑模型,包括:获取所述多个训练后的初始逻辑模型的模型梯度;基于所述模型梯度更新所述初始逻辑模型的模型参数,得到目标逻辑模型。3.根据权利要求1所述的方法,其中,所述控制所述多个初始逻辑模型基于样本数据进行训练,包括:控制所述多个初始逻辑模型中的每个初始逻辑模型从所述样本数据中获取子样本数据;控制所述每个初始逻辑模型基于对应的子样本数据进行训练。4.根据权利要求1所述的方法,其中:所述训练逻辑数据包括:损失函数信息以及梯度信息;所述基于所述训练逻辑数据构建多个初始逻辑模型,包括:基于所述损失函数信息配置所述初始逻辑模型的模型参数;基于所述模型参数以及所述梯度信息构建逻辑模型计算图以及梯度计算图。5.根据权利要求1所述的方法,还包括:接收用户输入的控制信息,所述控制信息能够用于生成控制指令,所述控制指令用于控制所述初始逻辑模型的训练。6.根据权利要求4所述的方法,其中,所述控制所述多个初始逻辑模型基于样本数据进行训练,包括根据预设循环次数循环执行:控制所述多个初始逻辑模型中的每个初始逻辑模型从所述样本数据中获取子样本数据;控制所述多个初始逻辑模型基于相应的子样本数据分别进行训练,得到与所述多个初始逻辑模型的对应的多组模型梯度;基于所述多组模型梯度更新所述初始逻辑模型的模型参数。7.根据权利要求4所述的方法,用于电子设备,所述电子设备包括参数服务器和多个计算节点,所述计算节点包括多个计算单元,所述每个计算单元包括所述初始逻辑模型,所述方法包括:控制每个计算...
【专利技术属性】
技术研发人员:王鹏,向辉,胡文晖,王奇刚,师忠超,
申请(专利权)人:联想北京有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。