【技术实现步骤摘要】
卷积神经网络的处理方法和装置
本申请涉及计算机
的卷积神经网络
,尤其涉及一种卷积神经网络的处理方法和装置。
技术介绍
卷积神经网络是深度学习的关键技术,但是由于卷积神经网络模型具有数量级大、层次复杂、深度大等特点,使用传统处理器单元进行卷积计算时存在效率较低的问题;尤其在语音信号处理等时延要求敏感的场景,卷积计算延迟使得系统实时性要求面临巨大挑战。相关技术中,卷积神经网络在基于模型具体参数处理时,是在所有点完成点积计算后,集中进行激活处理。由于激活处理的速度较慢,导致现有的卷积神经网络存在计算效率低的技术问题。
技术实现思路
本申请第一方面实施例提出了一种卷积神经网络的处理方法,所述卷积神经网络包括卷积参数寄存器、多个加速器寄存器、与所述多个加速器寄存器分别相连的多个运算单元和与所述多个运算单元分别相连的多个累加器,所述方法包括:获取输入矩阵、权重矩阵、激活标识、激活函数和权重矩阵组数;当所述权重矩阵组数小于或等于所述累加器的个数时,分别将所述输入矩阵和所述权 ...
【技术保护点】
1.一种卷积神经网络的处理方法,其特征在于,所述卷积神经网络包括卷积参数寄存器、多个加速器寄存器、与所述多个加速器寄存器分别相连的多个运算单元和与所述多个运算单元分别相连的多个累加器,所述方法包括:/n获取输入矩阵、权重矩阵、激活标识、激活函数和权重矩阵组数;/n当所述权重矩阵组数小于或等于所述累加器的个数时,分别将所述输入矩阵和所述权重矩阵输入至所述多个加速器寄存器;/n控制所述多个运算单元从所述多个加速器寄存器之中读取所述输入矩阵和所述权重矩阵,并生成多个运算结果;以及/n将所述多个运算结果输入所述多个累加器进行累加以生成累加结果,并根据所述激活标识和所述激活函数对所述 ...
【技术特征摘要】
1.一种卷积神经网络的处理方法,其特征在于,所述卷积神经网络包括卷积参数寄存器、多个加速器寄存器、与所述多个加速器寄存器分别相连的多个运算单元和与所述多个运算单元分别相连的多个累加器,所述方法包括:
获取输入矩阵、权重矩阵、激活标识、激活函数和权重矩阵组数;
当所述权重矩阵组数小于或等于所述累加器的个数时,分别将所述输入矩阵和所述权重矩阵输入至所述多个加速器寄存器;
控制所述多个运算单元从所述多个加速器寄存器之中读取所述输入矩阵和所述权重矩阵,并生成多个运算结果;以及
将所述多个运算结果输入所述多个累加器进行累加以生成累加结果,并根据所述激活标识和所述激活函数对所述累加结果进行激活。
2.如权利要求1所述的卷积神经网络的处理方法,其特征在于,所述分别将所述输入矩阵和所述权重矩阵输入至所述多个加速器寄存器之前,还包括:
如果所述权重矩阵组数小于或等于所述累加器的个数,则对所述输入矩阵进行转换以生成转换输入矩阵,并对所述权重矩阵进行转换以生成转换权重矩阵;以及
分别将所述转换输入矩阵和所述转换权重矩阵输入所述多个加速器寄存器。
3.如权利要求2所述的卷积神经网络的处理方法,其特征在于,所述对所述输入矩阵进行转换以生成转换输入矩阵,包括:
将所述输入矩阵C*H*W在内存之中转换为H*W*C,其中,C为所述输入矩阵的通道数,H为所述输入矩阵的高,所述W为所述输入矩阵的宽。
4.如权利要求2或3所述的卷积神经网络的处理方法,其特征在于,所述对所述权重矩阵进行转换以生成转换权重矩阵,包括:
将所述权重矩阵数据C*K*K在所述内存中转换为K*K*C*C’,其中,C’为所述权重矩阵组数,K为卷积核尺寸。
5.如权利要求1-3任一项所述的卷积神经网络的处理方法,其特征在于,所述多个加速器寄存器为两个,所述多个运算单元的个数与所述加速器寄存器的大小相对应。
6.如权利要求5所述的卷积神经网络的处理方法,其特征在于,所述运算单元的个数为256个,所述加速器寄存器的大小为256字节,所述累加器的个数为64个。
7.一种卷积神经网络的处理装置,其特征在于,所述卷积神经网络包括卷积参数寄存器、多个加速器寄存器、与所述多个加速器寄存器分别相连的多个运算单元和与所述多个运算单元分别相连的多个累加器,所述装置包括:
获取模块,用于获取输入...
【专利技术属性】
技术研发人员:李强,田超,路阔,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。