一种基于FPGA的并行CNN-LSTM架构实现系统技术方案

技术编号:42125085 阅读:17 留言:0更新日期:2024-07-25 00:41
本发明专利技术公开了一种基于FPGA的并行CNN‑LSTM架构实现系统,包括:控制模块、操作模块和存储模块;控制模块用于产生控制数据流,控制数据流包括使能信号、不同单元的复位信号和同步信号;操作模块包括并行CNN‑LSTM架构网络,用于数据的计算、存储、拼接和输出;存储模块基于FPGA上的BRAM实现,BRAM分为四个部分,分别存储网络输入数据、网络输出数据、训练得到的权重数据以及用于激活函数拟合的函数值。本发明专利技术将采用模块化设计思想,创新的将并行CNN‑LSTM网络在FPGA平台上部署,设计了一个灵活、通用的深度学习实现框架,各模块间可以根据不同任务修改参数并灵活互联,降低了随着网络结构深度增加带来的高运算量。

【技术实现步骤摘要】

本专利技术涉及人工智能,更具体地,涉及一种基于fpga的并行cnn-lstm架构实现系统。


技术介绍

1、当前深度学习技术蓬勃发展,卷积神经网络(cnn)、循环神经网络(rnn)等较为成熟的深度学习架构已被应用于多个领域。不同的深度学习框架有各自的优点以及擅长解决的问题,例如cnn擅长提取图像特征,并对这些特征图进行处理,通过训练和使用每层中的权重来对图像进行分类;长短时记忆(lstm)神经网络作为一种特殊的rnn,可以有效解决rnn中存在的梯度消失问题,并且可以轻松学习到长期依赖信息,在长序列建模问题时效果更好,但其在处理相关信号方面效果欠佳。当前多项研究发现可以将cnn与lstm连接,同时利用两种网络的结构的优点来提取数据的相关信息和时序信息,并以此提高数据处理效果。这种cnn-lstm网络架构已被应用在图像识别、语音识别等多个领域。

2、然而,在具体实现过程中,现有技术多将cnn与lstm串行连接,一般是将lstm网络连接在cnn后,这种连接方式前面cnn处理数据的过程可能会导致时序信息的丢失,不利于后续lstm继续运算,且随着计算深度的本文档来自技高网...

【技术保护点】

1.一种基于FPGA的并行CNN-LSTM架构实现系统,包括:

2.如权利要求1所述的基于FPGA的并行CNN-LSTM架构实现系统,其特征在于:

3.如权利要求2所述的基于FPGA的并行CNN-LSTM架构实现系统,其特征在于:

4.如权利要求2所述的基于FPGA的并行CNN-LSTM架构实现系统,其特征在于:

5.如权利要求2所述的基于FPGA的并行CNN-LSTM架构实现系统,其特征在于:

6.如权利要求2所述的基于FPGA的并行CNN-LSTM架构实现系统,其特征在于:

7.如权利要求6所述的基于FPGA的并...

【技术特征摘要】

1.一种基于fpga的并行cnn-lstm架构实现系统,包括:

2.如权利要求1所述的基于fpga的并行cnn-lstm架构实现系统,其特征在于:

3.如权利要求2所述的基于fpga的并行cnn-lstm架构实现系统,其特征在于:

4.如权利要求2所述的基于fpga的并行cnn-lstm架构实现系统,其特征在于:

5.如权利要求2所述的基于fpga的并行cnn-lstm架构实现系统,其特征在于:

6....

【专利技术属性】
技术研发人员:谢伟周鑫周晗程永靖李留文任云
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1