【技术实现步骤摘要】
本公开实施例涉及数据处理领域,具体地涉及一种带掩码的规约操作优化方法、装置、设备及介质。
技术介绍
1、规约是gpu编程中将计算并行化处理从而完成高性能计算的方式,目前主流的gpu编程模型提供了用于算术求和、求最大最小值、逻辑与、逻辑或和逻辑非的规约计算api。在gpu并行编程中,规约算法通常由一组并行运行的线程利用共享内存共同完成运算,且这组线程得到的结果也一致。现有技术中规约算法无法在一次调用中完成多个线程分组的计算,并且占用有限的共享内存,已有的规约api也无法较好的处理线程分组的计算。如何在规约操作中提高并行运算的效率以及节省存储空间,是亟待解决的问题。
技术实现思路
1、本专利技术的目的在于提供一种带掩码的规约操作优化方法、装置、设备及介质,以便于至少部分地解决上述问题。
2、根据本公开的一个方面,提出一种带掩码的规约操作优化方法,包括:
3、步骤s1,基于使用场景为线程束中的每个线程设置掩码,所述掩码按顺序标记线程束中对应线程通道是否参与规约操作,并传入
...【技术保护点】
1.一种带掩码的规约操作优化方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于:
3.根据权利要求1所述的方法,其特征在于:
4.根据权利要求1-3任一项所述的方法,其特征在于:
5.根据权利要求1-3任一项所述的方法,其特征在于:
6.一种带掩码的规约操作优化装置,其特征在于,所述装置包括:
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
9.根据权利要求6-8任一项所述的装置
...【技术特征摘要】
1.一种带掩码的规约操作优化方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于:
3.根据权利要求1所述的方法,其特征在于:
4.根据权利要求1-3任一项所述的方法,其特征在于:
5.根据权利要求1-3任一项所述的方法,其特征在于:
6.一种带掩码的规约操作优化装置,其特征在于,所述装置包括:
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
...
【专利技术属性】
技术研发人员:武桓州,周洲,董兆华,
申请(专利权)人:沐曦集成电路南京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。