【技术实现步骤摘要】
本申请涉及fpga,尤其涉及一种fpga板卡、数据处理方法及算法加速系统。
技术介绍
1、随着神经网络技术的不断发展,深度学习领域逐渐由传统神经网络中的cnn(convolutional neural network,卷积神经网络)和rnn(recurrent neural network,循环神经网络)算法转变为了transformer算法等。
2、以transformer算法为例,transformer网络结构是由attention机制组成,主要用于nlp领域生成训练语言模型,例如机器翻译等。在transformer算法中包含有大量矩阵向量的乘法计算和加法计算等,若直接通过上位机的cpu(central processing unit,中央处理器)来进行矩阵计算将会非常缓慢,从而影响算法效率。
技术实现思路
1、本申请实施例提供了一种fpga板卡、数据处理方法及算法加速系统,能够解决上位机实现矩阵计算较为缓慢,影响算法效率的技术问题。
2、第一方面,本申请实施例
...【技术保护点】
1.一种FPGA板卡,其特征在于,所述FPGA板卡包括:
2.根据权利要求1所述的FPGA板卡,其特征在于,所述处理单元模块包括:
3.根据权利要求2所述的FPGA板卡,其特征在于,所述权重存储单元还用于存储计算ffn算子结果所需的第二权重参数;所述多个功能函数模块包括:
4.根据权利要求1所述的FPGA板卡,其特征在于,所述数据缓存模块还包括内存控制器,所述XDMA与所述内存控制器通信连接。
5.根据权利要求1所述的FPGA板卡,其特征在于,所述通信接口为PCIe。
6.一种数据处理方法,应用于权利要求1-
...【技术特征摘要】
1.一种fpga板卡,其特征在于,所述fpga板卡包括:
2.根据权利要求1所述的fpga板卡,其特征在于,所述处理单元模块包括:
3.根据权利要求2所述的fpga板卡,其特征在于,所述权重存储单元还用于存储计算ffn算子结果所需的第二权重参数;所述多个功能函数模块包括:
4.根据权利要求1所述的fpga板卡,其特征在于,所述数据缓存模块还包括内存控制器,所述xdma与所述内存控制器通信连接。
5.根据权利要求1所述的fpga板卡,其特征在于,所述通信接口为pcie。
6.一种数据处理方法,应用于权利要求1-5中任一项所述的fpga板卡,所述方法包括:
7.根据权利要求6所述的数据处理方法,其特征在于,所述根据所述计算逻辑顺序对所述...
【专利技术属性】
技术研发人员:吴文渊,
申请(专利权)人:苏州华太电子技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。