一种支持多GPU Atomic指令操作的方法及装置制造方法及图纸

技术编号：44618881 阅读：21 留言：0更新日期：2025-03-17 18:18

本发明专利技术涉及GPU计算技术领域，具体为一种支持多GPU Atomic指令操作的方法及装置。包括：用户根据需求下发任务到GPU，GPU的执行模块对任务进行解析并执行，会发出指令；Atomic指令编码模块根据指令操作码判断是否为Atomic指令；若是，将指令操作码控制信息编码到PCIe TLP Prefix，并传输到目的GPU；若否，则直接到目的GPU的Atomic指令解码模块进行解码；从PCIe TLP Prefix中解码出指令操作码；若为需要返回原始数据的Atomic指令会返回完成状态及原始数据；否则无需读取指令地址的原始数据；根据执行结果生成任务完成包并返回给用户。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及gpu计算，具体地说，涉及一种支持多gpu atomic指令操作的方法及装置。

技术介绍

1、大数据时代，算力已成为推动数字经济发展的动力。而随着对数据的计算需求越来越高，gpu已成为算力基础设施重要的组成部分。gpu芯片拥有数量巨大的计算核心和强大的指令集，其最大的优势在于并行处理能力，尤其通过多gpu并行执行，可以显著提高数据处理速度，可广泛应用于数据中心、人工智能等众多领域中。在多gpu通信中，atomic指令通常用于确保在不同gpu之间执行操作时的原子性，特别是在涉及到共享内存或者需要同步更新数据的场景中。atomic操作可以保证即使多个gpu同时对同一内存地址进行操作，每个操作也都能在没有其他操作干扰的情况下正确执行。它们在多gpu训练和并行计算中非常有用，尤其是在需要累积梯度、更新参数或者实现某些同步机制时。例如，在多gpu训练一个深度神经网络时，每个gpu可能会计算一部分梯度，然后需要将这些梯度汇总到一个全局的梯度中。使用atomic指令可以确保在更新全局梯度时，不同gpu计算的梯度能够正确地累加，而不会发生...

【技术保护点】

1.一种支持多GPU Atomic指令操作的方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的支持多GPU Atomic指令操作的方法，其特征在于：所述S1中，用户需要多GPU共同完成一个任务，发送任务给GPU。

3.根据权利要求1所述的支持多GPU Atomic指令操作的方法，其特征在于：所述S2中，支持的Atomic类型包括但不限于逻辑运算、加法、减法、乘法、自加1、自减1、最大值、最小值、替换、比较操作；以及支持自定义的数据位宽，包括但不限于4bit、8bit、16bit、32bit、64bit、128bit数据大小。