【技术实现步骤摘要】
神经网络模型的处理方法及处理装置
[0001]本公开涉及计算机
,特别涉及一种神经网络模型的处理方法及处理装置、推理方法、推理装置、电子设备、计算机可读存储介质。
技术介绍
[0002]随着神经网络在各行各业中得到应用,神经网络的加速执行和压缩存储变成了一个很重要的问题,支持神经网络的加速器也不断涌现。在神经网络加速技术中,量化是一类非常重要的技术,其通过降低数据精度来加速计算,同时保证低精度数据描述的神经网络在任务上的精度尽可能接近原有的高精度网络,进而同时实现了加速和压缩模型的目的。
[0003]对于时序神经网络等需要在时间或空间上共享一套模型参数(如权重参数和量化参数)的神经网络,由于量化后的神经网络在不同时间步或空间上共享相同的权重参数和量化参数,导致其量化误差会随着神经网络的基本处理单元的不断迭代训练而累积,最终会造成模型难以优化进而导致模型产生严重的精度损失。
技术实现思路
[0004]本公开提供一种神经网络模型的处理方法及处理装置、推理方法、推理装置、电子设备、计算机可读存储介质。
[0005]第一方面,本公开提供了一种神经网络模型的处理方法,所述处理方法包括:
[0006]基于基础神经网络模型的基础权重序列,生成多个第一权重序列,所述多个第一权重序列构成权重池;
[0007]根据预先获取的记忆矩阵和所述权重池,生成多个目标权重序列;
[0008]基于多个目标权重序列,生成由多个所述基础神经网络模型构成的目标神经网络模型,在所述目标神经网络模 ...
【技术保护点】
【技术特征摘要】
1.一种神经网络模型的处理方法,其特征在于,所述处理方法包括:基于基础神经网络模型的基础权重序列,生成多个第一权重序列,所述多个第一权重序列构成权重池;根据预先获取的记忆矩阵和所述权重池,生成多个目标权重序列;基于多个目标权重序列,生成由多个所述基础神经网络模型构成的目标神经网络模型,在所述目标神经网络模型中,每个所述基础神经网络模型对应一个目标权重序列。2.根据权利要求1所述的处理方法,其特征在于,在生成所述目标神经网络模型之后,所述处理方法还包括:对所述目标神经网络模型进行训练,以更新所述记忆矩阵和所述权重池;在训练完成后,获得目标记忆矩阵和目标权重池。3.根据权利要求2所述的处理方法,其特征在于,所述对所述目标神经网络模型进行训练,包括:对所述目标神经网络模型进行量化感知训练。4.根据权利要求1所述的处理方法,其特征在于,在所述根据预先获取的记忆矩阵和所述权重池,生成多个目标权重序列之前,所述处理方法还包括:生成初始化的记忆矩阵,初始化的记忆矩阵由L个长度为K的向量构成,K为所述第一权重序列的数量,L为所述目标权重序列的数量;对初始化的记忆矩阵中每一行向量进行归一化处理,得到新的记忆矩阵。5.根据权利要求4所述的处理方法,其特征在于,所述生成初始化的记忆矩阵,包括:随机生成初始化的记忆矩阵;或者,当所述L为所述K的整数倍时,生成L/K个矩阵块,每个矩阵块的大小为K*K;将每个矩阵块初始化为单位矩阵,得到初始化的记忆矩阵。6.根据权利要求1所述的处理方法,其特征在于,所述根据预先获取的记忆矩阵和所述权重池,生成多个目标权重序列,包括:利用所述记忆矩阵对所述权重池中多个第一权重序列进行线性组合变换处理,得到多个目标权重序列。7.根据权利要求1所述的处理方法,其特征在于,所述基于基础神经网络模型的基础权重序列,生成多个第一权重序列,包括:将所述基础权重序列复制为多个,得到多个第一权重序列;或者,将多个随机数序列分别与所述基础权重序列进行求和计算,得到多个第一权重序列,所述随机数序列的长度与所述基础权重序列的长度相同。8.根据权利要求1所述的处理方法,其特征在于,所述基于基础神经网络模型的基础权重序列,生成多个第一权重序列,包括:基于所述基础权重序列,生成多个第二权重序列;基于所述多个第二权重序列,将所述基础神经网络模型按照执行时序扩展为多个基础神经网络模型,所述执行时序中每个时间步对应一个基础神经网络模型,每个基础神经网络模型对应一个第二权重序列;对所述多个基础神经网络模型进行量化感知训练,以更新所述多个第二权重序列,得到多个所述第一权重序列。9.根据权利要求1所述的处理方法,其特征在于,在所述基于基础神经网络模型...
【专利技术属性】
技术研发人员:张伟豪,曲环宇,王冠睿,
申请(专利权)人:北京灵汐科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。