一种支持多GPU Atomic指令操作的方法及装置制造方法及图纸

技术编号:44618881 阅读:21 留言:0更新日期:2025-03-17 18:18
本发明专利技术涉及GPU计算技术领域,具体为一种支持多GPU Atomic指令操作的方法及装置。包括:用户根据需求下发任务到GPU,GPU的执行模块对任务进行解析并执行,会发出指令;Atomic指令编码模块根据指令操作码判断是否为Atomic指令;若是,将指令操作码控制信息编码到PCIe TLP Prefix,并传输到目的GPU;若否,则直接到目的GPU的Atomic指令解码模块进行解码;从PCIe TLP Prefix中解码出指令操作码;若为需要返回原始数据的Atomic指令会返回完成状态及原始数据;否则无需读取指令地址的原始数据;根据执行结果生成任务完成包并返回给用户。

【技术实现步骤摘要】

本专利技术涉及gpu计算,具体地说,涉及一种支持多gpu atomic指令操作的方法及装置。


技术介绍

1、大数据时代,算力已成为推动数字经济发展的动力。而随着对数据的计算需求越来越高,gpu已成为算力基础设施重要的组成部分。gpu芯片拥有数量巨大的计算核心和强大的指令集,其最大的优势在于并行处理能力,尤其通过多gpu并行执行,可以显著提高数据处理速度,可广泛应用于数据中心、人工智能等众多领域中。在多gpu通信中,atomic指令通常用于确保在不同gpu之间执行操作时的原子性,特别是在涉及到共享内存或者需要同步更新数据的场景中。atomic操作可以保证即使多个gpu同时对同一内存地址进行操作,每个操作也都能在没有其他操作干扰的情况下正确执行。它们在多gpu训练和并行计算中非常有用,尤其是在需要累积梯度、更新参数或者实现某些同步机制时。例如,在多gpu训练一个深度神经网络时,每个gpu可能会计算一部分梯度,然后需要将这些梯度汇总到一个全局的梯度中。使用atomic指令可以确保在更新全局梯度时,不同gpu计算的梯度能够正确地累加,而不会发生竞态条件。pcie(本文档来自技高网...

【技术保护点】

1.一种支持多GPU Atomic指令操作的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的支持多GPU Atomic指令操作的方法,其特征在于:所述S1中,用户需要多GPU共同完成一个任务,发送任务给GPU。

3.根据权利要求1所述的支持多GPU Atomic指令操作的方法,其特征在于:所述S2中,支持的Atomic类型包括但不限于逻辑运算、加法、减法、乘法、自加1、自减1、最大值、最小值、替换、比较操作;以及支持自定义的数据位宽,包括但不限于4bit、8bit、16bit、32bit、64bit、128bit数据大小。

>4.根据权利要求1...

【技术特征摘要】

1.一种支持多gpu atomic指令操作的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的支持多gpu atomic指令操作的方法,其特征在于:所述s1中,用户需要多gpu共同完成一个任务,发送任务给gpu。

3.根据权利要求1所述的支持多gpu atomic指令操作的方法,其特征在于:所述s2中,支持的atomic类型包括但不限于逻辑运算、加法、减法、乘法、自加1、自减1、最大值、最小值、替换、比较操作;以及支持自定义的数据位宽,包括但不限于4bit、8bit、16bit、32bit、64bit、128bit数据大小。

4.根据权利要求1所述的支持多gpu atomic指令操作的方法,其特征在于:所述s5用于根据指令操作码从pcie tlp中获取atomic指令的地址及数据,同时传输到本地的执行模块。

5.根据权利要求1所述的支持多gpu atomic指令操作的方法,其特征在于:所...

【专利技术属性】
技术研发人员:王爽李学清杨华中杨冬李宗鹏请求不公布姓名
申请(专利权)人:沐曦集成电路上海股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1