一种适用于多种卷积模式的FIR滤波器实现制造技术

技术编号：17597888 阅读：25 留言：0更新日期：2018-03-31 10:49

本发明专利技术公开了一种可适用于多种卷积模式的FIR滤波器及其硬件实现，该结构可以支持目前卷积神经网络中主流的卷积运算，如步长为1的3*3和5*5的卷积计算以及步长为2的3*3卷积运算等，并运用6并行快速FIR算法来减小硬件消耗，降低卷积计算复杂度，提高数据吞吐率。本发明专利技术完成了步伐为2的三并行卷积运算的硬件结构推导，并在不增加加法器与乘法器的基础上将其与6并行快速FIR滤波器硬件结构相结合，使得该结构在适配的每种模式下都极大得利用了硬件资源。本发明专利技术通过该单一硬件结构的不同配置可以实现目前绝大多数主流的卷积神经网络计算，提高了硬件利用率，具备了高通用性，简化了卷积神经网络的硬件实现。

Implementation of a FIR filter suitable for multiple convolution modes

全部详细技术资料下载

【技术实现步骤摘要】
一种适用于多种卷积模式的FIR滤波器实现
本专利技术涉及计算机及电子科学领域，特别涉及深度学习领域卷积神经网络的硬件实现，一种兼容步伐为1卷积计算与步伐为2卷积运算的通用架构及硬件实现。
技术介绍
卷积神经网络(CNN)由于其在图像，音频等领域卓越的表现，如今已成为当前最为流行，且应用最广泛的深度学习算法之一。随着近年来卷积神经网络的飞速发展，大卷积核在模型中的应用已经越来越少，目前各个模型中运用最广泛的是3*3与5*5的卷积运算，并且步伐为2的卷积运算也被越来越多的模型运用到。而针对步伐为2的卷积运算，却一直没有一个很好的硬件实现优化方案。传统的步伐为1的卷积运算可以通过快速FIR算法以提高并行度并减少乘法器资源。一个N抽头的FIR滤波器在时域的多项式表示为：或者在z域中可以表示为若将长度为N的FIR滤波器系数序列{h(n)}作为N维离散卷积的系数，则该FIR滤波器可以实现一个N维的卷积运算。通过N个该滤波器的组合，可以实现卷积神经网络中N*N的卷积运算。而快速FIR算法可以实现高并行度，以及通过增加加法器而减少乘法器的方法来实现低复杂度。但是该方法对于步长为2的卷积运算并不合适，通过该方法进行计算并选择性的输出来实现步长为2的卷积会带来硬件资源的严重浪费，每个周期内都有约50％的硬件资源对计算结果是无影响的。所以一种既能够实现传统步长为1的卷积运算又能实现步长为2的卷积运算，且具有低复杂度、高并行度、高硬件资源利用率的通用硬件架构将成为一种需求。
技术实现思路
针对上述问题，本专利技术提出了一种在快速FIR算法框架上既可兼容步长为1又可兼容步长为2的卷积计...
一种适用于多种卷积模式的FIR滤波器实现

【技术保护点】
一种可适用于多种卷积模式的FIR滤波器，其硬件架构包括：1)数据输入选择单元，针对不同的卷积模式，将输入数据进行重新选择排列输入至相应的卷积计算模块。2)卷积计算单元，基本组成单元是3并行的3抽头快速FIR滤波器，并插入了数据选择器控制数据流来针对不同的卷积运算。3)卷积后计算单元，对卷积计算单元的的输出进行处理计算从而实现对卷积计算单元内多个独立组成单元的级联，形成一个多并行多抽头的快速FIR滤波器。4)数据输出选择单元，针对不同的卷积模式，选择与其对应的计算结果作为模块输出。

【技术特征摘要】
1.一种可适用于多种卷积模式的FIR滤波器，其硬件架构包括：1)数据输入选择单元，针对不同的卷积模式，将输入数据进行重新选择排列输入至相应的卷积计算模块。2)卷积计算单元，基本组成单元是3并行的3抽头快速FIR滤波器，并插入了数据选择器控制数据...

【专利技术属性】
技术研发人员：王中风，袁炅，林军，
申请(专利权)人：南京大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人