【技术实现步骤摘要】
原子操作的处理方法、装置、电子设备和存储介质
[0001]本公开涉及计算机
,尤其涉及一种原子操作的处理方法、装置、电子设备和存储介质。
技术介绍
[0002]GPU(Graphics Processing Unit,图形处理器)可以支持数千个线程并行运行,而这些线程可能需要并行访问某些数据结构。在许多场景中,每个线程可能希望独占这些数据,在其他线程访问相同数据之前执行一系列操作,而这可以通过原子操作来实现。
[0003]数据结构的元素可以有很多,分别驻留在不同的内存地址。如果一组线程恰好访问数据结构中的不同元素,即来自不同线程的原子操作的目的地址不同,则不同线程的原子操作可以并行执行。
[0004]然而,若一组线程的原子操作针对的是同一内存地址,那么,为了正确执行各线程的原子操作,各线程的原子操作需要顺序进行,即,需要等待第一个线程的原子操作完成后才能开始第二个线程的原子操作,需要等待第二个线程的原子操作完成后才能开始第三个线程的原子操作,以此类推。这导致系统吞吐量较低,程序执行速度较慢。
技术实现思路
[0005]本公开提供了一种原子操作的处理技术方案。
[0006]根据本公开的一方面,提供了一种原子操作的处理方法,包括:
[0007]响应于至少三个线程对内存中的同一目标元素进行同一目标类型的原子操作,且所述目标类型的原子操作符合结合律,在第一个处理阶段,对所述目标元素的原值和所述至少三个线程对应的至少三个数值进行分组,并对各个分组并行进行所述目标类型的原子操 ...
【技术保护点】
【技术特征摘要】
1.一种原子操作的处理方法,其特征在于,包括:响应于至少三个线程对内存中的同一目标元素进行同一目标类型的原子操作,且所述目标类型的原子操作符合结合律,在第一个处理阶段,对所述目标元素的原值和所述至少三个线程对应的至少三个数值进行分组,并对各个分组并行进行所述目标类型的原子操作,得到第二个处理阶段的输入值;根据所述第二个处理阶段的输入值,得到所述至少三个线程对应的最终原子操作结果。2.根据权利要求1所述的方法,其特征在于,所述根据所述第二个处理阶段的输入值,得到所述至少三个线程对应的最终原子操作结果,包括:响应于第i个处理阶段的输入值的数量大于或等于3,对所述第i个处理阶段的输入值进行分组,并对各个分组并行进行所述目标类型的原子操作,得到第i+1个处理阶段的输入值,其中,i为大于或等于2的整数;响应于第i个处理阶段的输入值的数量为2,对所述第i个处理阶段的2个输入值进行所述目标类型的原子操作,得到所述至少三个线程对应的最终原子操作结果,其中,i为大于或等于2的整数。3.根据权利要求1或2所述的方法,其特征在于,响应于任一处理阶段的输入值的数量大于或等于3,且所述处理阶段的输入值的数量为偶数,将所述处理阶段的输入值两两分组;或者,响应于任一处理阶段的输入值的数量大于或等于3,且所述处理阶段的输入值的数量为奇数,将所述处理阶段的输入值中的一项作为所述处理阶段的下一处理阶段的输入值,并对所述处理阶段的其他输入值两两分组。4.根据权利要求1所述的方法,其特征在于,所述目标类型的原子操作为以下任意一种操作:原子加操作、原子替换操作、原子与操作、原子或操作、原子异或操作。5.根据权利要求1或4所述的方法,其特征在于,在所述响应于至少三个线程对内存中的同一目标元素进行同一目标类型的原子操作,且所述目标类型的原子操作符合结合律,在第一个处理阶段,对所述目标元素的原值和所述至少三个线程对应的至少三个数值进行分组之前,所述方法还包括:响应于至少三个线程对内存中的同一目标元素进行原子减操作,对所述至少三个线程对应的至少三个数值分别取反,并将所述原子减操作转换为原子加操作。6.根据权利要求1所述的方法,其特征在于,所述在第一个处理阶段,对所述目标元素的原值和所述至少三个线程对应的至少三个数值进行分组,并对各个分组并行进行所述目标类型的原子操作,得到第二个处理阶段的输入值,包括:在所述第一个处理阶段,将所述目标元素的原值和所述至少三个线程对应的至少三个数值划分为个分组,并通过个计算单元并行对所述个分组进行所述目标类型的原子操作,得到第二个处理阶段的输入值,其中,T表示对内存中的同一目标元素进行同一目标类型的原子操作的线程的数量,表示向下取整。7.根据权利要求6所述的方法,其特征在于,所述根据所述第二个处理阶段的输入值,
得到所述至少三个线程对应的最终原子操作结果,包括:响应于第i个处理阶段的输入值的数量大于或等于3,将所述第i个处理阶段的输入值划分为个分组,并通过个计算单元并行对所述个分组进行所述目标类型的原子操作,得到第i+1个处理阶段的输入值,其中,i为大于或等于2的整数,N表示所述第i个处理阶段的输入值的数量;响应于第i个处理阶段的输入值的数量为2,通过一个计算单元对所述第i个处理阶段的2个输入值进行所述目标类型的原子操作,得到所述至少三个线程对应的最终原子操作结果,其中,i为大于或等于2的整数。8.根据权利要求7所述的方法,其特征在于,通过包含T个计算单元的计算架构处理T个线程,其中,所述T个计算单元中的任一计算单元包括两个输入端和一个输出端,且T个计算单元分别对应于所述T个线程中的不同线程;第一个处理阶段中的一个计算单元的两个输入端分别输入所述计算单元...
【专利技术属性】
技术研发人员:请求不公布姓名,
申请(专利权)人:摩尔线程智能科技北京有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。