面向向量处理器的基于SIMD的平均值值池化并行处理方法技术

技术编号：15896028 阅读：396 留言：0更新日期：2017-07-28 20:10

一种面向向量处理器的基于SIMD的平均值值池化并行处理方法，其步骤为：S1：设定池化矩阵和池化窗口；S2：根据池化窗口尺寸k，取池化矩阵A的前k行元素进行相应的累加操作，得出前k行元素对应的列和；S3：配置混洗模式并进行混洗；S4：将步骤S3中得到的结果对应相加；S5：重复步骤S3、S4直到每组元素的数值归约至p/k个VPE中为止；S6：使用向量VMOVI指令将立即数

SIMD based mean value pooling parallel processing method for vector processors

Based on the average value of SIMD parallel processing pool oriented vector processor, which comprises the following steps: S1: set the pool matrix and pool window; S2: according to the pool of window size k, accumulate the corresponding operations before the k elements from pool of matrix A, k elements to get the the column and S3 configuration: shuffle mode; and shuffle; S4: get in step S3 the results of the corresponding add; S5: S3, repeat steps S4 until each element of the data reduction to p/k VPE so far; S6: using vector VMOVI instruction will be immediate

全部详细技术资料下载

【技术实现步骤摘要】
面向向量处理器的基于SIMD的平均值值池化并行处理方法
本专利技术主要涉及到卷积神经网络
，特指一种面向向量处理器的基于SIMD的平均值值池化并行处理方法。
技术介绍
20世纪60年代，Hubel和Wiesel在研究猫脑皮层中用于局部敏感和方向选择的神经元时发现其独特的网络结构可以有效地降低反馈神经网络的复杂性，继而提出了卷积神经网络(ConvolutionalNeuralNetwork，CNN)。当前，卷积神经网络已经成为众多学科领域的研究热点之一，特别是在模式分类领域，由于该网络避免了对图像的复杂前期预处理，可以直接输入原始图像，因而得到了更加广泛的应用。一般地，一个用于识别的卷积神经网络计算模型包括卷积层、池化层、全连接层以及后续的分类器。卷积层通过使用不同规模的卷积核来提取上一层图像的局部特征，一旦该局部特征被提取后，它与其它特征间的位置关系也随之确定下来；然后，通过求局部平均(也称池化操作)进行特征映射，得到降维后的特征信息，该特征信息输出到下一个卷积层继续进行相应的处理，直到到达最后一层(输出层)，从而得到最终输出结果。当前主流的卷积神经网络模型中采用的池化操作主要是平均值池化(AveragePooling)和最大值池化(MaxPooling)，平均值池化和最大值池化是两种不同的池化方法，但是本质上都是为了降低大尺寸图像的维度，降低计算量，因此在卷积神经网络中占据重要的位置。平均值池化是取一定尺寸像素中的平均值，比如，n×n大小规模，最大值池化是取一定尺寸像素中的最大值。鉴于池化操作在卷积神经网络中的重要作用，因此在计算量十分巨大的卷积神...
面向向量处理器的基于SIMD的平均值值池化并行处理方法

【技术保护点】
一种面向向量处理器的基于SIMD的平均值值池化并行处理方法，其特征在于，步骤为：S1：设卷积操作后需要进行池化操作的池化矩阵为A，其大小为M×N，池化窗口的尺寸为k×k，且M>k，N>k，向量处理单元的个数为p，且M、N、p为k的整数倍；S2：根据池化窗口尺寸k，取池化矩阵A的前k行元素进行相应的累加操作，得出前k行元素对应的列和；S3：配置混洗模式并进行混洗；S4：将步骤S3中得到的结果对应相加；S5：重复步骤S3、S4直到每组元素的数值归约至p/k个VPE中为止；S6：使用向量VMOVI指令将立即数

【技术特征摘要】
1.一种面向向量处理器的基于SIMD的平均值值池化并行处理方法，其特征在于，步骤为：S1：设卷积操作后需要进行池化操作的池化矩阵为A，其大小为M×N，池化窗口的尺寸为k×k，且M>k，N>k，向量处理单元的个数为p，且M、N、p为k的整数倍；S2：根据池化窗口尺寸k，取池化矩阵A的前k行元素进行相应的累加操作，得出前k行元素对应的列和；S3：配置混洗模式并进行混洗；S4：将步骤S3中得到的结果对应相加；S5：重复步骤S3、S4直到每组元素的数值归约至p/k个VPE中为止；S6：使用向量VMOVI指令将立即数赋值给一个向量寄存器，并将此向量寄存器与步骤S5中的累加和一一对应相乘；S7：最终得出p/k个平均值池化的结果向量；S8：顺移至池化矩阵A的k+1行，重复上述步骤S2到步骤S7直至遍历完池化矩阵A的所有子图，得到池化矩阵A的所有尺寸为k×k的平均值池化结果矩阵。2.根据权利要求1所述的面向向量处理器的基于SIMD的平均值值池化并行处理方法，其特征在于，所述步骤S3的详细流程...

【专利技术属性】
技术研发人员：郭阳，张军阳，扈啸，王慧丽，胡敏慧，王子聪，
申请(专利权)人：中国人民解放军国防科学技术大学，
类型：发明
国别省市：湖南,43

全部详细技术资料下载我是这个专利的主人