【技术实现步骤摘要】
一种深度神经网络训练方法、系统、装置、设备及介质
[0001]本申请涉及深度学习
,更具体地说,涉及一种深度神经网络训练方法、系统、装置、设备及介质。
技术介绍
[0002]在过去几年里,深度神经网络(DNN)获得了广泛的应用,包括图像和视频分类,语音识别和语言翻译。然而随着DNN越来越广泛地开发和使用,模型尺寸变得越来越大,使得高效的模型训练变得更加重要。tensorflow、pytorch等深度学习框架,以及GPU、ASIC芯片等各种硬件加速器的出现,为神经网络训练性能提升做出了巨大贡献。然而,深度神经网络的训练过程存在功耗高、并行度低的缺点,适用性差。
[0003]综上所述,如何提高深度神经网络训练方法的适用性是目前本领域技术人员亟待解决的问题。
技术实现思路
[0004]本申请的目的是提供一种深度神经网络训练方法,其能在一定程度上解决如何提高深度神经网络训练方法的适用性的技术问题。本申请还提供了一种深度神经网络训练系统、装置、设备及计算机可读存储介质。
[0005]为了实现上述目 ...
【技术保护点】
【技术特征摘要】
1.一种深度神经网络训练方法,其特征在于,应用于连接器,包括:获取深度学习框架发送的深度神经网络训练任务;通过nGraph框架传输所述深度神经网络训练任务至目标FPGA,以使所述目标FPGA执行所述深度神经网络训练任务。2.根据权利要求1所述的方法,其特征在于,所述获取深度学习框架发送的深度神经网络训练任务,包括:通过各个子进程获取所述深度学习框架发送的各个深度神经网络训练子任务;将所有的所述深度神经网络训练子任务拼接为主进程中的所述深度神经网络训练任务。3.根据权利要求2所述的方法,其特征在于,所述通过nGraph框架传输所述深度神经网络训练任务至目标FPGA,以使所述目标FPGA执行所述深度神经网络训练任务,包括:基于所述主进程,通过所述nGraph框架传输所述深度神经网络训练任务至所述目标FPGA,以使所述目标FPGA中的各个FPGA执行对应的所述深度神经网络训练子任务。4.根据权利要求3所述的方法,其特征在于,所述基于所述主进程,通过所述nGraph框架传输所述深度神经网络训练任务至所述目标FPGA之后,还包括:基于所述主进程,通过所述nGraph框架接收所述目标FPGA传输的任务执行结果,所述任务执行结果包括所述各个FPGA对对应的所述深度神经网络训练子任务的子执行结果;将所述任务执行结果拆分为与各个所述子进程对应的所述子执行结果...
【专利技术属性】
技术研发人员:曹芳,李仁刚,赵雅倩,郭振华,王丽,高开,
申请(专利权)人:广东浪潮智慧计算技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。