【技术实现步骤摘要】
所属的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。与上述方法实施例基于同一专利技术构思,本申请实施例中还提供了一种电子设备。在一种实施例中,该电子设备可以是服务器,也可以是终端设备。在该实施例中,电子设备的结构可以如图12所示,包括存储器1201,通讯模块1204以及至少一个gpu 1202和多个cpu1203。存储器1201,用于存储gpu 1202和cpu 1203执行的计算机程序。存储器1201可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统,以及运行即时通讯功能所需的程序等;存储数据区可存储各种即时通讯信息和操作指令集等。存储器1201可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,ram);存储器1201也可以是非易失性存储器(non-volatilememor
...【技术保护点】
1.一种模型训练加速方法,其特征在于,应用于目标CPU,所述方法包括:
2.如权利要求1所述的方法,其特征在于,在所述模型的训练数据的数据类型为第二数据类型的情况下,所述损失值是基于模型损失尺度对损失初始值调整得到的,所述损失初始值是根据所述前向预测结果得到的。
3.如权利要求2所述的方法,其特征在于,所述模型损失尺度用于增大所述损失初始值;
4.如权利要求2所述的方法,其特征在于,所述模型损失尺度用于增大所述损失初始值;
5.如权利要求4所述的方法,其特征在于,所述方法还包括:
6.如权利要求1至5中任一项
...【技术特征摘要】
1.一种模型训练加速方法,其特征在于,应用于目标cpu,所述方法包括:
2.如权利要求1所述的方法,其特征在于,在所述模型的训练数据的数据类型为第二数据类型的情况下,所述损失值是基于模型损失尺度对损失初始值调整得到的,所述损失初始值是根据所述前向预测结果得到的。
3.如权利要求2所述的方法,其特征在于,所述模型损失尺度用于增大所述损失初始值;
4.如权利要求2所述的方法,其特征在于,所述模型损失尺度用于增大所述损失初始值;
5.如权利要求4所述的方法,其特征在于,所述方法还包括:
6.如权利要求1至5中任一项所述的方法,其特征在于,所述目标cpu属于cpu集,所述cpu集与所述gpu之间存在亲和性,且所述cpu集中的所有cpu属于同一个numa节点。
7.一种模型训练加速方法,其特征在于,应用于gpu,所述方法包括:
8.如权利要求7所述的方法,其特征在于,所述根据模型的前向预测结果计算所述模型的损失值,包括:
9.如权利要求8所述的方法,其特征在于,所述方法还包括:
10.如权利要求8所述的方...
【专利技术属性】
技术研发人员:弓静,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。