基于线程束内洗牌算法的位数组分块整理方法和装置制造方法及图纸

技术编号:42597540 阅读:22 留言:0更新日期:2024-09-03 18:10
本申请涉及一种基于线程束内洗牌算法的位数组分块整理方法和装置,该方法包括:对当前GPU上运行的线程块中的所有线程束进行标记,得到奇、偶线程束,并确定每个线程束中有效数据的范围;将奇、偶线程束内的有效数据划分为两两一对,计算每个数据对的标识;根据该标识对部分数据进行调整;根据数据对偶线程束和奇线程束内有效数据进行移动,将线程束内数据分为两组;将线程块中两个相邻线程束作为一个线程束对,以线程束对为基本单位移动数据,完成当前GPU上线程块内标记位数组的整理。本方法利用线程束内洗牌算法实现了标记位二进制数组的分块整理,优化了GPU上线程调度问题,提升了GPU计算效率。

【技术实现步骤摘要】

本申请涉及计算流体力学与高性能计算,特别是涉及一种基于线程束内洗牌算法的位数组分块整理方法和装置


技术介绍

1、位数组(bitarry),又称为二进制数组,指数组中仅包含0和1的数组。由于位数组的元素很容易映射到二进制位,与计算机内部的数据表示方式一致,因此在计算科学中存在广泛的用途。

2、ugkwp方法即气体动理学波粒方法,是一种多尺度介观方法,在描述气体的非平衡效应方面具有优异的性能,在稀薄流域和连续流域都能保持准确性,是航空航天和其他多尺度流动模拟领域的重要工具。在ugkwp方法的执行过程中,在每个迭代都会根据模拟粒子的飞行时间tf与时间步长dt的大小关系对模拟粒子进行分类,tf小于dt的粒子会在此时间步内发生碰撞,称为pc粒子,在pc粒子发生碰撞后,其携带的物理信息会被合并到宏观量中;tf大于等于dt的粒子在整个时间步内都会以特定的速度自由飞行而不会经历任何碰撞,被称为pf粒子,其携带的物理信息会保留到下一个时间步。pc粒子所在的内存空间会被标记为“0”,pf粒子所在的内存空间会被标记为“1”,因此模拟粒子的标记位就自然构成一个二进制本文档来自技高网...

【技术保护点】

1.一种基于线程束内洗牌算法的位数组分块整理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,有效数据的范围指的是标记位为1的最小索引和最大索引之间的数据;

3.根据权利要求2所述的方法,其特征在于,数据对为(1,1)时,数据对标识为A;数据对为(0,0)时,数据对标识为B;数据对为(1,0)时,数据对标识为C;数据对为(0,1)时,数据对标识为D;

4.根据权利要求3所述的方法,其特征在于,将数据对标识为C和D两种情况合并的具体步骤包括:

5.根据权利要求1所述的方法,其特征在于,根据数据对的标识对所述偶线程束和...

【技术特征摘要】

1.一种基于线程束内洗牌算法的位数组分块整理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,有效数据的范围指的是标记位为1的最小索引和最大索引之间的数据;

3.根据权利要求2所述的方法,其特征在于,数据对为(1,1)时,数据对标识为a;数据对为(0,0)时,数据对标识为b;数据对为(1,0)时,数据对标识为c;数据对为(0,1)时,数据对标识为d;

4.根据权利要求3所述的方法,其特征在于,将数据对标识为c和d两种情况合并的具体步骤包括:

5.根据权利要求1所述的方法,其特征在于,根据数据对的标识对所述偶线程束和奇线程束内有效数据进行移动,将线程束内数据分为两组,包括:

6.根据权利要求5所述的方法,其特征在于,将移动后的线程束内的有效数据进行分组。

7.根据权利要求1所述的方法,其特征在于,偶线程束中标记位为“1”的有效数据集中在数组的前半段,奇线程束中标...

【专利技术属性】
技术研发人员:于航谢文佳田正雨任伟杰褚雨航
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1