一种针对大容量数据的FPGA和基于opencl的FPGA算法制造技术

技术编号：21999956 阅读：19 留言：0更新日期：2019-08-31 05:19

本发明专利技术提供一种针对大容量数据的FPGA和基于opencl的FPGA算法，属于数据计算技术领域。该FPGA包括FPGA控制器，与FPGA控制器指令通信的pcie接口、Flash控制器、DDR控制器和算法模块；还包括由所述Flash控制器控制的Flash存储器和由所述DDR控制器控制的DDR存储器；所述Flash控制器与DDR控制器指令通信，所述DDR控制器与算法模块指令通信；所述pcie接口与Flash控制器之间数据传输，所述Flash控制器与DDR控制器之间数据传输，所述DDR控制器与算法模块之间数据传输。该方法通过在原有的FPGA上设置Flash控制器和Flash存储器，使主机通过pcie接口将大量的待计算数据一次搬移到Flash存储器，再将每个待计算数据搬移到DDR存储器中，避免了多次通过pcie接口搬移数据，实现算法加速效果。

A FPGA and Opencl-based FPGA algorithm for large-capacity data

全部详细技术资料下载

【技术实现步骤摘要】
一种针对大容量数据的FPGA和基于opencl的FPGA算法
本专利技术属于数据计算
，尤其涉及一种针对大容量数据的FPGA和基于opencl的FPGA算法。
技术介绍
在目前的基于opencl算法架构中，主机通过pcie接口将数据搬移到FPGA外挂的DDR中。kernel算法模块从DDR中取出数据，进行算法逻辑运算，运算完后再将运算好的数据发回DDR中，然后主机通过pcie接口将运算好的数据从DDR中取出。这种现有技术中，由于把DDR作为缓存，存储资源有限，且DDR的硬件比较复杂，增加DDR数量，对FPGA的硬件要求较高，而且由于每次主机收发数据时，pcie接口链路消耗的时间资源比较大，降低了kernel算法模块单位时间内的使用率，限制了算法的性能。对于需要如神经网络算法、图像处理算法等这类大容量的算法，上述技术不能快速的进行算法计算。
技术实现思路
为解决上述技术问题，本专利技术提供一种针对大容量数据的FPGA，采用该FPGA后，能够极大的加快数据的计算速度。本专利技术采用的技术方案如下：一种针对大容量数据的FPGA，包括FPGA控制器，与FPGA控制器指令通信的pcie接口、Flash控制器、DDR控制器和算法模块；还包括由所述Flash控制器控制的Flash存储器和由所述DDR控制器控制的DDR存储器；所述Flash控制器与DDR控制器指令通信，所述DDR控制器与算法模块指令通信；所述pcie接口与Flash控制器之间数据传输，所述Flash控制器与DDR控制器之间数据传输，所述DDR控制器与算法模块之间数据传输。更进一步地，所述Flash控制器...

【技术保护点】
1.一种针对大容量数据的FPGA，其特征在于，包括FPGA控制器，与FPGA控制器指令通信的pcie接口、Flash控制器、DDR控制器和算法模块；还包括由所述Flash控制器控制的Flash存储器和由所述DDR控制器控制的DDR存储器；所述Flash控制器与DDR控制器指令通信，所述DDR控制器与算法模块指令通信；所述pcie接口与Flash控制器之间数据传输，所述Flash控制器与DDR控制器之间数据传输，所述DDR控制器与算法模块之间数据传输。

【技术特征摘要】
1.一种针对大容量数据的FPGA，其特征在于，包括FPGA控制器，与FPGA控制器指令通信的pcie接口、Flash控制器、DDR控制器和算法模块；还包括由所述Flash控制器控制的Flash存储器和由所述DDR控制器控制的DDR存储器；所述Flash控制器与DDR控制器指令通信，所述DDR控制器与算法模块指令通信；所述pcie接口与Flash控制器之间数据传输，所述Flash控制器与DDR控制器之间数据传输，所述DDR控制器与算法模块之间数据传输。2.根据权利要求1所述的一种针对大容量数据的FPGA，其特征在于，所述Flash控制器控制有至少两个Flash存储器。3.根据权利要求1或2所述的一种针对大容量数据的FPGA，其特征在于，所述FPGA控制器通过pcie接口与主机指令通信。4.根据权利要求1或2所述的一种针对大容量数据的FPGA，其特征在于，所述Flash控制器通过pcie接口与主机数据传输。5.一种基于opencl的FPGA算法，包括以下步骤：Step1：主机通过pcie接口，将至少一个待计算数据搬移到第一Flash存储器；Step2：将一个所述待计算数据从第一Flash存储器搬移到DDR存储器中；Step3：算法模块从DDR存储器中读取一个所述待计算数据，并进行计算，计算完后，算法模块将一个已计算数据发回DDR存储器中；Step4：将DDR存储器中的已计算数据搬移到第二Flash存储器；Step5：重复Step2～Step4，直至第一Flash存储器内的所有待计算数据均经过算法模块计算变为已计算数据存储至第二Flash存储器；Step6：将第二Flash存储器中的已计算数据通过pcie接口，搬移到主机中。6.根据权利要求5所述的一种基于FPGA的算法加速方...

【专利技术属性】
技术研发人员：杨威锋，云飞龙，
申请(专利权)人：方一信息科技上海有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人