【技术实现步骤摘要】
一种雅克比模版计算加速方法、系统、介质及存储设备
本专利技术属于电子
,具体涉及一种雅克比模版计算加速方法、系统、介质及存储设备。
技术介绍
模版计算(StencilComputation)是一种根据固定的“模版”形式迭代更新数组元素值的计算方式。常用于流体动力学计算和电磁学等科学计算的数值模拟。在众多的模版计算类别中,雅克比(Jacobi)计算在线性方程组的求解领域具有广泛的研究和广泛的应用。图1为1DJacobi计算示意图,其中横轴为空间维度i,纵轴为时间维t,图中每一个实心黑点表示一个迭代实例(cell),所有迭代实例组成了迭代空间。1DJacobi由于空间维度为一维,所以其迭代空间为二维空间。箭头方向表示迭代实例之间的依赖关系,其中,箭头指向方向的迭代实例称为目标实例(target),箭头发出方向的迭代实例称为源实例(source)。图2为对应的1DJacobi计算的示例代码。模版计算更新数据时采用的计算模版有很多种,模版类型取决于对应的应用领域,以图1为例,每一个迭代实例由其上一时间步(t-1 ...
【技术保护点】
1.一种雅克比模版计算加速方法,其特征在于,包括以下步骤:/nS1、在雅克比模版计算的初始迭代状态,FPGA芯片f
【技术特征摘要】 【专利技术属性】
1.一种雅克比模版计算加速方法,其特征在于,包括以下步骤:
S1、在雅克比模版计算的初始迭代状态,FPGA芯片fi分别运行第一类六边形分块计算内容,i=1,2,...,n;
S2、将步骤S1运算完成后各FPGA芯片的片上BU保存成Cell数据用于下一类迭代;
S3、进行第二类六边形分块运算,保存运算结果,将下次迭代所需的数据存入片上BU;
S4、重复步骤S2~S3,分别迭代完成第一类六边形分块计算和第二类六边形分块计算,直到整个模版计算的时间轴内的迭代实例运算完毕,得到最终步数据OC;
S5、将步骤S4的最终步数据OC从各FPGA芯片的片上BU输出至片外BRAM,数据持久化后得到雅克比模版计算结果。
2.根据权利要求1所述的方法,其特征在于,步骤S1的雅克比模版计算中,对于FPGA集群F中的每块芯片,FPGA芯片fi=(ws,wl,h),ws代表运行在FPGA芯片上的六边形分块短宽度,wl代表运行在FPGA芯片上的六边形分块长宽度,h代表运行在FPGA芯片上的六边形分块的高度。
3.根据权利要求1所述的方法,其特征在于,步骤S1中,第一类六边形分块为(fi,fi+1)所在同一水平面的所有分块,运行第一类六边形分块计算内容得到第二类六边形分块运行所需的所有数据,在后续第二类六边形分块运行时,直接用第一类六边形分块计算得到的内容开始运算。
4.根据权利要求1所述的方法,其特征在于,步骤S2和S3中,每一个六边形分块对应一个FPGA芯片fi,分块运行时,控制器将输入迭代实例从片外内存DRAM中读入FPGA片上缓存,读取完毕后片上处理引擎进行块内运算,运算结束后将结果输出至片上BU,写入片外DRAM进行存储,用于下一个六边形分块迭代运行调用。
技术研发人员:伍卫国,王今雨,康益菲,冯雅琦,栗怡文,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。