一种CNN加速器数据存取方法及系统技术方案

技术编号：33916481 阅读：33 留言：0更新日期：2022-06-25 20:19

本发明专利技术涉及一种CNN加速器数据存取方法及系统，属于计算、推算技术领域，包括：预设训练参数，获取输入特征图并存储于缓存区中；对缓存区中的输入特征图进行判断处理并通过寄存器阵列处理得到预取数据，对预取数据进行循环处理得到序后数据；对序后数据进行卷积计算处理得到卷积数据；对卷积数据依次进行批量归一化、RELU激活函数激活、量化、池化和FIFO缓存处理得到输出结果；对输出结果的处理层数进行判断处理，从而实现全片上存储，获得目标坐标；有效降低了内存带宽和功耗。效降低了内存带宽和功耗。效降低了内存带宽和功耗。

全部详细技术资料下载

【技术实现步骤摘要】
一种CNN加速器数据存取方法及系统

[0001]本专利技术涉及一种CNN加速器数据存取方法及系统，属于计算、推算

技术介绍

[0002]近年来，深度学习极大地促进了机器学习的发展，卷积神经网络(Convolutional Neutral Network，CNN)受生物学上感受野的机制而提出，是一种具有局部连接、权重共享以及汇聚等特性的深层前馈神经网络，也是深度学习中一种出色的学习模型，因为其取得的极为先进的性能而广泛应用于处理图像信息、语音信息等诸多应用领域。与传统方法相比，取得高精度和实时的目标识别能力的同时，它也需要更多的计算处理和内存资源，这必须依赖于大型服务器，现通用的处理器已经无法满足其需求，可以通过底层应用加速计算过程结合深度学习算法上的优化，来推动CNN算法应用行业的发展。
[0003]目前，嵌入式移动终端面临着片上资源有限与高性能和低功耗的挑战，CNN网络有大量的参数，大多都是将庞大的参数存储在外部存储器中，内存带宽成为加速CNN网络的一个严重问题，对于庞大的乘加运算和复杂的控制信号，需要深入研究数据流和计算模式来最大化应用片上资源。

技术实现思路

[0004]本专利技术的目的在于克服现有技术中的不足，提供一种CNN加速器数据存取方法及系统，可有效降低内存带宽和功耗。
[0005]为达到上述目的，本专利技术是采用下述技术方案实现的：
[0006]第一方面，本专利技术提供了一种CNN加速器数据存取方法，包括：
[0007]预设训练参数，获取输入特...

【技术保护点】

【技术特征摘要】
1.一种CNN加速器数据存取方法，其特征在于，包括：预设训练参数，获取输入特征图并存储于缓存区中；对缓存区中的输入特征图进行判断处理并通过寄存器阵列处理得到预取数据，对预取数据进行循环处理得到序后数据；对序后数据进行卷积计算处理得到卷积数据；对卷积数据依次进行批量归一化、RELU激活函数激活、量化、池化和FIFO缓存处理得到输出结果；对输出结果的处理层数进行判断处理，从而实现全片上存储，获得目标坐标。2.根据权利要求1所述的CNN加速器数据存取方法，其特征在于，所述训练参数包括输入特征图的尺寸和权重。3.根据权利要求1所述的CNN加速器数据存取方法，其特征在于，所述缓存区存储有不同通道的输入特征图。4.根据权利要求1所述的CNN加速器数据存取方法，其特征在于，对缓存区中的输入特征图进行判断处理的方法包括：根据缓存区中的输入特征图计算输入特征图地址，判断输入特征图地址是否为输入特征图的边缘；若判断结果为是，则对缓存区中的输入特征图进行补零，将补零后的输入特征图进行寄存器阵列处理；若判断结果为否，则直接将缓存区中的输入特征图进行寄存器阵列处理。5.根据权利要求4所述的CNN加速器数据存取方法，其特征在于，根据缓存区中的输入特征图计算输入特征图地址的方法包括：其中，address为输入特征图地址，channel为通道偏移地址，为特征图的缓存分区，[w]为特征图一行像素值的并向上取最邻近的2的幂的值，group为组偏移地址，row为行偏移地址。6.根据权利要求1所述的CNN加速器数据存取方法，其特征在于，通过寄存器阵列处理得到预取数据的方法包括：于缓存区中所有通道的输入特征图的第零地址开始，取前M行、第M+1行和第M+2行进行三次循环完成(M+2)行

【专利技术属性】
技术研发人员：张娟，梁天柱，张广明，疏建，王汉霖，
申请(专利权)人：昆山市工业技术研究院有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人