当前位置: 首页 > 专利查询>南京大学专利>正文

基于卷积神经网络的加速器及加速方法技术

技术编号:40101092 阅读:29 留言:0更新日期:2024-01-23 17:42
本申请提供一种基于卷积神经网络的加速器及加速方法,加速器包括:编译器、获取单元、片上储存器、计算单元;通过将片上储存器分为缓存模式和储存模式,在缓存模式时,片上储存器被分为多层缓存区,输入特征图逐行写入当前缓存区内,将得到的中间特征图和输入特征图输入下一层缓存区;在储存模式时,片上储存器被分为两个储存区,将输入特征图写入一个存储区中,将得到的中间特征图写入另一个存储区中,在两个储存区内交替计算。再根据编译器解析ONNX模型,可通过ONNX模型中的算子组对输入特征图分类,以为输入特征图选择片上储存器不同的运行模式,减少运算过程中数据的重复搬运,以解决卷积神经网络硬件加速器计算效率低的问题。

【技术实现步骤摘要】

本申请涉及神经网络领域,尤其涉及一种基于卷积神经网络的加速器及加速方法


技术介绍

1、卷积神经网络已经广泛应用于计算机视觉、自然语言处理等领域。然而,卷积神经网络的特有计算模式,通用处理器对于卷积神经网络的实现效率并不高,不能满足性能要求。因此,近来已经提出了基于现场可编程门阵列(field-programmable gate arrayfpga),图形处理器(graphics processing unit gpu)、专用集成电路(applicationspecific integrated circuit asic)设计的各种卷积神经网络硬件加速器来提高卷积神经网络的性能。

2、卷积神经网络硬件加速器综合了功耗低和卷积相关运算速度快的特点,成为部署卷积神经网络运算的主流硬件之一。但由于卷积神经网络模型种类众多,且不同模型拥有不同的数据分布、权重分布、计算流等特点,模型内不同的计算层也有不同的数据尺寸,为适应不同的计算流和数据流牺牲计算效率;而且在加速器内部,数据的传输和运算是顺序进行,计算阵列需要等待数据传输完毕才开始运算,在等待数据传输本文档来自技高网...

【技术保护点】

1.一种基于卷积神经网络的加速器,其特征在于,包括:

2.根据权利要求1所述的基于卷积神经网络的加速器,其特征在于,所述SRAM包括多行内存;

3.根据权利要求1所述的基于卷积神经网络的加速器,其特征在于,

4.根据权利要求3所述的基于卷积神经网络的加速器,其特征在于,所述编译器包括中端;

5.根据权利要求4所述的基于卷积神经网络的加速器,其特征在于,所述交替信息包括起始行、终止行、起始列、终止列、起始通道、终止通道;

6.根据权利要求4所述的基于卷积神经网络的加速器,其特征在于,所述编译器还包括后端,所述加速器还包括指令寄存器...

【技术特征摘要】

1.一种基于卷积神经网络的加速器,其特征在于,包括:

2.根据权利要求1所述的基于卷积神经网络的加速器,其特征在于,所述sram包括多行内存;

3.根据权利要求1所述的基于卷积神经网络的加速器,其特征在于,

4.根据权利要求3所述的基于卷积神经网络的加速器,其特征在于,所述编译器包括中端;

5.根据权利要求4所述的基于卷积神经网络的加速器,其特征在于,所述交替信息包括起始行、终止行、起始列、终止列、起始通道、终止通道;

6.根据权利要求4所述的基于卷积神经网络的加速器,其特征在于,所述编译器还包括后端,所述加速器还包括指令寄存器;

<...

【专利技术属性】
技术研发人员:杜力张晓鹏白一川杜源
申请(专利权)人:南京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1