一种带掩码的规约操作优化方法、装置、设备及介质制造方法及图纸

技术编号:40004221 阅读:28 留言:0更新日期:2024-01-09 04:33
本发明专利技术公开一种带掩码的规约操作优化方法、装置、设备及介质,属于数据处理领域,方法基于使用场景为线程束中每个线程设置掩码,每个线程获取自身通道值,自身通道值对应线程在掩码中的序号,基于掩码获取当前线程所属线程束中第一个线程通道值,每个线程按照步长从大到小进行规约操作,将规约操作对应的另一个线程中的数据基于掩码进行处理后再与当前线程的数据进行操作,每个线程获取对应线程束中第一个线程通道中的操作结果,根据每个线程在掩码中的标记返回最终值。该方法利用线程间数据访问替代共享内存读写,通过掩码在比特位上的设置表示线程的分组,在一次计算中可完成多个线程分组的计算,提高规约操作效率,节省存储空间。

【技术实现步骤摘要】

本公开实施例涉及数据处理领域,具体地涉及一种带掩码的规约操作优化方法、装置、设备及介质


技术介绍

1、规约是gpu编程中将计算并行化处理从而完成高性能计算的方式,目前主流的gpu编程模型提供了用于算术求和、求最大最小值、逻辑与、逻辑或和逻辑非的规约计算api。在gpu并行编程中,规约算法通常由一组并行运行的线程利用共享内存共同完成运算,且这组线程得到的结果也一致。现有技术中规约算法无法在一次调用中完成多个线程分组的计算,并且占用有限的共享内存,已有的规约api也无法较好的处理线程分组的计算。如何在规约操作中提高并行运算的效率以及节省存储空间,是亟待解决的问题。


技术实现思路

1、本专利技术的目的在于提供一种带掩码的规约操作优化方法、装置、设备及介质,以便于至少部分地解决上述问题。

2、根据本公开的一个方面,提出一种带掩码的规约操作优化方法,包括:

3、步骤s1,基于使用场景为线程束中的每个线程设置掩码,所述掩码按顺序标记线程束中对应线程通道是否参与规约操作,并传入每个线程待规约操作的本文档来自技高网...

【技术保护点】

1.一种带掩码的规约操作优化方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于:

3.根据权利要求1所述的方法,其特征在于:

4.根据权利要求1-3任一项所述的方法,其特征在于:

5.根据权利要求1-3任一项所述的方法,其特征在于:

6.一种带掩码的规约操作优化装置,其特征在于,所述装置包括:

7.根据权利要求6所述的装置,其特征在于,所述装置还包括:

8.根据权利要求6所述的装置,其特征在于,所述装置还包括:

9.根据权利要求6-8任一项所述的装置,其特征在于:...

【技术特征摘要】

1.一种带掩码的规约操作优化方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于:

3.根据权利要求1所述的方法,其特征在于:

4.根据权利要求1-3任一项所述的方法,其特征在于:

5.根据权利要求1-3任一项所述的方法,其特征在于:

6.一种带掩码的规约操作优化装置,其特征在于,所述装置包括:

7.根据权利要求6所述的装置,其特征在于,所述装置还包括:

...

【专利技术属性】
技术研发人员:武桓州周洲董兆华
申请(专利权)人:沐曦集成电路南京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1