基于卷积的数据处理方法和设备技术

技术编号:29283658 阅读:18 留言:0更新日期:2021-07-16 23:38
本申请实施例提供一种基于卷积的数据处理方法和设备,其中,该方法包括:读取卷积阵列中的各卷积核存储单元中的同一卷积维度上的权重参数单元,并读取待处理数据中的各移动窗口下的与卷积维度对应的特征数据;将各移动窗口下的与卷积维度对应的特征数据、与卷积阵列中的各卷积核存储单元中的同一卷积维度上的权重参数单元之间分别进行卷积运算,得到各输出数据;根据在各特征数据上所得到的输出数据,得到各输出维度上的数据组合,以得到输出数据。降低读取卷积核存储单元的次数,降低读取特征数据的次数。降低对内部数据传输带宽的占用,不需要占用更多的内部数据传输带宽,降低对其他的数据传输和数据过程的影响。低对其他的数据传输和数据过程的影响。低对其他的数据传输和数据过程的影响。

Convolution based data processing method and equipment

【技术实现步骤摘要】
基于卷积的数据处理方法和设备


[0001]本申请涉及人工智能
,具体涉及一种基于卷积的数据处理方法和设备。

技术介绍

[0002]随着人工智能技术的发展,智能的运算设备开始得到广泛的应用,可以将智能的运算设备应用到各类
中,例如应用到大数据处理领域、算力领域、图像处理领域。并且,由于深度学习已经成为了人工智能技术中重要算法,运算设备逐渐开始运行深度学习算法中的卷积神经网络算法,完成数据运算。
[0003]现有技术中,运算设备在运行卷积神经网络算法进行数据运算的时候,运算设备需要读取一个窗口大小下的特征数据,并且读取一个卷积核存储单元;然后,运算设备将一个窗口大小下的特征数据与一个卷积核存储单元之间进行卷积运算。运算设备再读取下一个窗口大小下的特征数据,并且读取下一个卷积核存储单元,将此时读取的特征数据与卷积核存储单元之间进行卷积运算。以此类推。进而运算设备完成数据运算。
[0004]然而现有技术中,运算设备在运行卷积神经网络算法进行数据运算的时候,运算设备需要对特征数据和卷积核存储单元进行多次的读取,读取次数较高;会使得运算设备的内部数据传输带宽的占用较多,对内部数据传输带宽的需求较高;甚至在运算设备进行卷积运算的时候,影响到其他的数据传输和数据过程。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种基于卷积的数据处理方法和设备。
[0006]第一方面,本申请提供了一种基于卷积的数据处理方法,包括:
[0007]读取卷积阵列中的各卷积核存储单元中的同一卷积维度上的权重参数单元,并读取待处理数据中的各移动窗口下的与所述卷积维度对应的特征数据;其中,所述待处理数据为数据矩阵,所述待处理数据中包括至少一个特征数据,所述卷积阵列中包括至少一个卷积核存储单元,每一所述卷积核存储单元中包括不同卷积维度上的权重参数单元;
[0008]将所述各移动窗口下的与所述卷积维度对应的特征数据、与卷积阵列中的各卷积核存储单元中的同一卷积维度上的权重参数单元之间分别进行卷积运算,得到各输出数据;
[0009]根据在各所述特征数据上所得到的输出数据,得到各输出维度上的数据组合,以得到输出数据,其中,所述输出数据包括每一所述输出维度上的数据组合。
[0010]第二方面,本申请提供了一种运算设备,包括:处理器;
[0011]所述处理器,用于:
[0012]读取卷积阵列中的各卷积核存储单元中的同一卷积维度上的权重参数单元,并读取待处理数据中的各移动窗口下的与所述卷积维度对应的特征数据;其中,所述待处理数据为数据矩阵,所述待处理数据中包括至少一个特征数据,所述卷积阵列中包括至少一个卷积核存储单元,每一所述卷积核存储单元中包括不同卷积维度上的权重参数单元;
[0013]将所述各移动窗口下的与所述卷积维度对应的特征数据、与卷积阵列中的各卷积核存储单元中的同一卷积维度上的权重参数单元之间分别进行卷积运算,得到各输出数据;
[0014]根据在各所述特征数据上所得到的输出数据,得到各输出维度上的数据组合,以得到输出数据,其中,所述输出数据包括每一所述输出维度上的数据组合。
[0015]第三方面,本申请提供了一种处理装置,所述处理装置包括一个或多个本申请实施例第一方面所述的运算装置,用于执行指定的数据运算,将执行结果通过I/O接口传递给其他处理装置;
[0016]当所述处理装置包含多个所述运算装置时,所述多个所述运算装置间可以通过特定的结构进行连接并传输数据;
[0017]其中,多个所述运算装置通过快速外部设备互连总线PCIE总线进行互联并传输数据;多个所述运算装置共享同一控制系统或拥有各自的控制系统;多个所述运算装置共享内存单元或者拥有各自的内存单元。
[0018]第四方面,本申请提供了一种组合处理装置,包括如本申请实施例第三方面所述的处理装置,通用互联接口和其他处理装置;
[0019]所述处理装置与所述其他处理装置进行交互,共同完成用户指定的操作。
[0020]第五方面,本申请提供了一种芯片,所述芯片包括如本申请实施例第三方面所述的处理装置或如本申请实施例第四方面所述的组合处理装置。
[0021]第六方面,本申请提供了一种板卡,所述板卡包括如本申请实施例第五方面所述的芯片。
[0022]第七方面,本申请提供了一种电子装置,所述电子装置包括如本申请实施例第五方面所述的芯片或者如本申请实施例第六方面所述的板卡。
[0023]以上,本申请实施例的方案中,在读取卷积核存储单元的时候,可以读取各卷积核存储单元中的同一卷积维度上的权重参数单元,进而可以降低读取卷积核存储单元的次数;并且,在读取待处理数据的时候,可以读取各移动窗口下的与卷积维度对应的特征数据,进而不需要多次读取相同的特征数据,可以降低读取特征数据的次数,进而降低读取待处理数据的次数;然后,对读取到的特征数据和卷积核存储单元进行卷积运算。由于降低了读取待处理数据的次数,进而可以降低对内部数据传输带宽的占用,不需要占用更多的内部数据传输带宽,降低对其他的数据传输和数据过程的影响。进一步地,还可以降低读取卷积核存储单元的次数,进一步的降低了对内部数据传输带宽的占用。从而,进一步实现了运算设备的硬件加速。
附图说明
[0024]图1为本申请实施例提供的应用场景示意图一;
[0025]图2为本申请实施例提供的应用场景示意图二;
[0026]图3为本申请实施例提供的应用场景示意图三;
[0027]图4为本申请实施例提供的卷积神经网络算法的示意图;
[0028]图5为本申请实施例提供的一种基于卷积的数据处理方法的流程示意图;
[0029]图6为本申请实施例提供的卷积核存储单元的示意图;
[0030]图7为本申请实施例提供的卷积阵列的示意图;
[0031]图8为本申请实施例提供的待处理数据的示意图;
[0032]图9为本申请实施例提供的另一种基于卷积的数据处理方法的流程示意图;
[0033]图10为本申请实施例提供的卷积运算的运算过程示意图一;
[0034]图11为本申请实施例提供的卷积运算的运算过程示意图二;
[0035]图12为本申请实施例提供的一种运算设备的示意图;
[0036]图13为本申请实施例提供的另一种运算设备的示意图;
[0037]图14为本申请实施例提供的一种处理装置的示意图;
[0038]图15为本申请实施例提供的一种组合处理装置的示意图;
[0039]图16为本申请实施例提供的一种芯片的示意图一;
[0040]图17为本申请实施例提供的一种芯片的示意图二;
[0041]图18为本申请实施例提供的一种芯片的示意图三;
[0042]图19为本申请实施例提供的一种板卡的示意图;
[0043]图20为本申请实施例提供的一种电子装置的示意图一;
[0044]图21为本申本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于卷积的数据处理方法,其特征在于,包括:读取卷积阵列中的各卷积核存储单元中的同一卷积维度上的权重参数单元,并读取待处理数据中的各移动窗口下的与所述卷积维度对应的特征数据;其中,所述待处理数据为数据矩阵,所述待处理数据中包括至少一个特征数据,所述卷积阵列中包括至少一个卷积核存储单元,每一所述卷积核存储单元中包括不同卷积维度上的权重参数单元;将所述各移动窗口下的与所述卷积维度对应的特征数据、与卷积阵列中的各卷积核存储单元中的同一卷积维度上的权重参数单元之间分别进行卷积运算,得到各输出数据;根据在各所述特征数据上所得到的输出数据,得到各输出维度上的数据组合,以得到输出数据,其中,所述输出数据包括每一所述输出维度上的数据组合。2.根据权利要求1所述的方法,其特征在于,读取卷积阵列中的各卷积核存储单元中的同一卷积维度上的权重参数单元,包括:重复执行以下步骤,直至读取完卷积阵列中的各卷积核存储单元的权重参数单元,其中,i和j的初始值为0:在每一个时钟周期内,读取所述卷积阵列中的第i个卷积核存储单元的第j个卷积维度上的权重参数单元;若i小于I,则确定i累加1;若i等于I,则确定i=0,并且j累加1;其中,i为大于等于0、小于等于I的整数,j为大于等于0、小于等于J的整数;I为一个卷积阵列中的卷积核存储单元的个数总和,J为卷积核存储单元的卷积维度的总个数,I、J为大于等于1的整数。3.根据权利要求2所述的方法,其特征在于,所述读取待处理数据中的各移动窗口下的与所述卷积维度对应的特征数据,包括:重复执行以下步骤,直至读取完所述待处理数据中的特征数据,其中,m和j的初始值为0:在所述每一个时钟周期内,读取第m个移动窗口下的与第j个卷积维度对应的特征数据;若m小于M,则确定m累加1;若m等于M,则确定M=0,并且j累加1;其中,m为大于等于0、小于等于M的整数,M为移动窗口的总个数,M为大于等于1的整数。4.根据权利要求3所述的方法,其特征在于,将所述各移动窗口下的与所述卷积维度对应的特征数据、与卷积阵列中的各卷积核存储单元中的同一卷积维度上的权重参数单元之间分别进行卷积运算,得到各输出数据,包括:在所述每一个时钟周期内,将已经读取到的各卷积核存储单元的第j个卷积维度上的权重参数单元、已经读取到的各移动窗口下的与第j个卷积维度对应的特征数据之间进行卷积运算,得到各输出数据。5.根据权利要求4所述的方法,其特征在于,所述进行卷积运算,得到各输出数据,包括:运行winograd算法进行卷积运算,得到各输出数据。6.根据权利要求1-5任一项所述的方法,其特征在于,在所述读取待处理数据中的各移
动窗口下的与所述卷积维度对应的特征数据之前,还包括:获取所述待处理数据,将所述待处理数据存储至缓存中。7.根据权利要求1-5任一项所述的方法,其特征在于,在所述读取卷积阵列中的各卷积核存储单元中的同一卷积维度上的权重参数单元之前,还包括:获取多个卷积核存储单元;将所述多个卷积核存储单元,构建出所述卷积阵列。8.一种运算设备,其特征在于,包括:处理器;所述处理器,用于:读取卷积阵列中的各卷积核存储单元中的同一卷积维度上的权重参数单元,并读取待处理数据中的各移动窗口下的与所述卷积维度对应的特征数据;其中,所述待处理数据为数据矩阵,所述待处理数据中包括至少一个特征数据,所述卷积阵列中包括至少一个卷积核存储单元,每一所述卷积核存储单元中包括不同卷积维度上的权重参数单元;将所述各移动窗口下的与所述卷积维度对应的特征数据、与卷积阵列中的各卷积核存储单元中的同一卷积维度上的权重参数单元之间分别进行卷积运算,得到各输出数据;根据...

【专利技术属性】
技术研发人员:屈家丽霍元宏沈广冲张广飞
申请(专利权)人:北京比特大陆科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1