The embodiment of the invention provides a convolution neural network acceleration device and method. The convolutional neural network accelerator comprises a scheduling unit which generates control commands according to the size/dimension of input data and the size/step size of the filter to control the behavior of the data moving unit and the row data expanding unit, and a data moving unit which actively stores empty space from the system according to the command of the scheduling unit. A row data caching unit for storing read-in raw input data; and a row data extending unit for reading out one row of raw data from the row data caching unit at a time, and then expanding the row data according to the size of the filter window It is shown as a row of data in different filter windows.
【技术实现步骤摘要】
一种卷积神经网络加速装置和方法
本专利技术涉及卷积神经网络领域,尤其涉及一种卷积神经网络加速装置和方法。
技术介绍
卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种前馈神经网络,与传统的BP神经网络相比,具有识别效率高、旋转缩放不变性好等优点,已在数字图像处理及人脸识别等各个领域得到了广泛的应用。传统卷积神经网络一般由多个交替的卷积层、池化层以及最后的全连接层组成。卷积神经网络可通过反向传播方法将网络损失传递到网络的所有层。参数更新学习过程通过随机梯度下降算法来实现。卷积神经网络与传统神经网络最大的区别在于,其卷积层采用了一种权值共享局部连接网络,而不是传统的权值独立全连接网络,这使得在层数相同的情况下,卷积神经网络的连接数目要远少于传统神经网络。卷积层的二维数据结构使得卷积神经网络非常适合于处理图像数据信息。此外,池化层的加入使得卷积神经网络对输入数据的几何变化(平移、缩放、旋转等)具有一定程度的稳健性。卷积神经网络由于其强大的数据特征提取能力和非线性学习能力,在性能上超越了大多数传统的机器视觉算法。目前在图像分类、目标识别等研究和应用领域,卷积神经网络已经成为主流方法。然而,基于卷积神经网络的图像处理技术,如图像识别技术,为了从复杂场景中分开并识别出每个物体,需要使用大量的模板对图像进行遍历卷积计算,其数据搬运量大,计算量大导致计算时间长,因此很难实现实时物体识别。异构计算系统是由主处理器和加速器两种体系结构处理器搭建而成的计算机系统。通过协调地使用性能、结构各异的处理单元,能够满足不同的计算需求,以获取最大总体性能方 ...
【技术保护点】
1.一种输入数据转换装置,包括:调度单元,所述调度单元根据输入数据的尺寸/维度及滤波器的尺寸/步长产生控制命令,控制数据搬移单元和行数据扩展单元的行为;数据搬移单元,根据所述调度单元的命令,主动从系统存储空间中读取原始输入数据;行数据缓存单元,所述行数据缓存单元用于存储读入的原始输入数据;以及行数据扩展单元,所述行数据扩展单元每次从所述行数据缓存单元中读出一行原始数据,然后按照滤波窗口的尺寸将行数据扩展为不同滤波窗口中的一行数据。
【技术特征摘要】
1.一种输入数据转换装置,包括:调度单元,所述调度单元根据输入数据的尺寸/维度及滤波器的尺寸/步长产生控制命令,控制数据搬移单元和行数据扩展单元的行为;数据搬移单元,根据所述调度单元的命令,主动从系统存储空间中读取原始输入数据;行数据缓存单元,所述行数据缓存单元用于存储读入的原始输入数据;以及行数据扩展单元,所述行数据扩展单元每次从所述行数据缓存单元中读出一行原始数据,然后按照滤波窗口的尺寸将行数据扩展为不同滤波窗口中的一行数据。2.如权利要求1所述的输入数据转换装置,其特征在于,还包括位宽转换单元,所述位宽转换单元将所述行数据扩展单元的扩展数据转换为统一的位宽,并输出到运算单元。3.如权利要求1所述的输入数据转换装置,其特征在于,所述行数据扩展单元是多路行数据扩展单元,多路行数据扩展单元同时扩展出多路滤波器窗口行数据。4.如权利要求1所述的输入数据转换装置,其特征在于,所述行数据缓存单元存储滤波窗口所需要的N行输入数据。5.如权利要求1所述的输入数据转换装置,其特征在于,所述行数据扩展单元从行缓存单元读入N行输入数据中的第一行数据,并扩展出全部滤波器窗口的该行数据;所述行数据扩展单元再从行缓存单元读入下一行数据,并扩展出全部滤波器窗口的该行数据;所述行数据扩展单元重复该动作直至扩展完成滤波器窗口里的所有N行数据;所述行数据缓存单元存储读入所述N行数据的下一行输入数据替换所述N行输入数据中的第一行数据,作为更新的N行输入数据;所述行数据扩展单元针对更新的N行输入数据,...
【专利技术属性】
技术研发人员:刘明润,陈亮,李晓鹏,
申请(专利权)人:上海熠知电子科技有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。