基于多核卷积神经网络的图像处理方法、装置及设备制造方法及图纸

技术编号:25837166 阅读:60 留言:0更新日期:2020-10-02 14:17
本申请公开了一种基于多核卷积神经网络的图像处理方法,该方法沿着宽度方向和高度方向对原始图像进行拆分,拆分之后的卷积运算过程中,核与核之间仅需要传递子图边界数据,有效降低了通信数据量;而且每个核需要缓存的数据大大减少,因而在处理器如FPGA中可以用片上RAM全部缓存,有效提高并行处理速度。此外,本申请还提供了一种基于多核卷积神经网络的图像处理装置及设备,其技术效果与上述方法的技术效果相同。

【技术实现步骤摘要】
基于多核卷积神经网络的图像处理方法、装置及设备
本申请涉及计算机
,特别涉及一种基于多核卷积神经网络的图像处理方法、装置及设备。
技术介绍
卷积神经网络是神经网络的一种,其通过仿造大脑视觉原理,能够通过大量数据输入,学习输入与输出的关系,广泛应用于深度学习、人工智能、大数据处理等领域。卷积神经网络通常包含有若干卷积层、池化层和全连接层。所谓卷积,即两个向量的点乘,假设一个向量为输入的图像3x3的区域,另一个向量为3x3的固定系数,该固定系数或者权重被称为卷积核。为提升效率,目前往往利用卷积神经网络进行并行处理,常见的方案有数据并行方案和算子并行方案等。通过将输入数据或者算子分给多个并行处理器进行计算,有效地降低了处理器整体运行的时间。然而,目前的多核并行处理方案中,核与核之间的通信数据量较大,影响卷积运算速度。
技术实现思路
本申请的目的是提供一种基于多核卷积神经网络的图像处理方法、装置及设备,用以解决目前的多核并行处理方案中,核与核之间的通信数据量较大,影响并行运算性能的问题。其具体方案如下:本文档来自技高网...

【技术保护点】
1.一种基于多核卷积神经网络的图像处理方法,其特征在于,包括:/n获取原始图像<C,H,W>,其中C为特征通道数,H为图像高度,W为图像宽度;/n将每个特征通道的图像沿着高度方向和/或宽度方向进行划分,得到两个以上子图,所述子图与单核运算模块一一对应,将各个所述子图分别发送至对应的单核运算模块;/n控制各个所述单核运算模块从相邻的单核运算模块获取子图边界数据,其中所述子图边界数据为与当前子图相邻的预设数量行或列的数据,所述预设数量为(K-1)/2,K为卷积核大小;/n控制各个所述单核运算模块对所述当前子图和所述子图边界数据进行卷积运算,得到所述当前子图的卷积结果;/n根据各个所述单...

【技术特征摘要】
1.一种基于多核卷积神经网络的图像处理方法,其特征在于,包括:
获取原始图像<C,H,W>,其中C为特征通道数,H为图像高度,W为图像宽度;
将每个特征通道的图像沿着高度方向和/或宽度方向进行划分,得到两个以上子图,所述子图与单核运算模块一一对应,将各个所述子图分别发送至对应的单核运算模块;
控制各个所述单核运算模块从相邻的单核运算模块获取子图边界数据,其中所述子图边界数据为与当前子图相邻的预设数量行或列的数据,所述预设数量为(K-1)/2,K为卷积核大小;
控制各个所述单核运算模块对所述当前子图和所述子图边界数据进行卷积运算,得到所述当前子图的卷积结果;
根据各个所述单核运算模块的卷积结果,生成所述原始图像的卷积结果。


2.如权利要求1所述的方法,其特征在于,在所述控制各个所述单核运算模块对所述当前子图和所述子图边界数据进行卷积运算,得到所述当前子图的卷积结果之前,还包括:
对原始卷积核的系数矩阵进行随机置零操作,得到不同的目标卷积核,并分别发送至各个单核运算模块。


3.如权利要求2所述的方法,其特征在于,所述对原始卷积核的系数矩阵进行随机置零操作,得到不同的目标卷积核,包括:
分别利用不同的置零模板对原始卷积核进行系数稀疏化,得到不同的目标卷积核,其中所述置零模板包括预设比例的置零元素。


4.如权利要求1所述的方法,其特征在于,所述获取原始图像<C,H,W>,包括:
获取四维张量<N,C,H,W>,其中N为并行图像数量,根据所述四维张量确定N个原始图像。


5.一种基于多核卷积神经网络的图像处理装置,其特征在于,包括:
图像获取模块:用于获取原始图像<C,H,W>,其中C为特征通道数,H为图像高度,W为图像宽度;
拆分模块:用于将每个特征通道的图像沿着高度方向和/或宽度方向进行划分,得到两个以上子图,所述子图与单核运算模块一一对应,...

【专利技术属性】
技术研发人员:梅国强郝锐赵红博阚宏伟
申请(专利权)人:浪潮北京电子信息产业有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1