【技术实现步骤摘要】
本专利技术涉及gpu计算,具体地说,涉及一种支持多gpu atomic指令操作的方法及装置。
技术介绍
1、大数据时代,算力已成为推动数字经济发展的动力。而随着对数据的计算需求越来越高,gpu已成为算力基础设施重要的组成部分。gpu芯片拥有数量巨大的计算核心和强大的指令集,其最大的优势在于并行处理能力,尤其通过多gpu并行执行,可以显著提高数据处理速度,可广泛应用于数据中心、人工智能等众多领域中。在多gpu通信中,atomic指令通常用于确保在不同gpu之间执行操作时的原子性,特别是在涉及到共享内存或者需要同步更新数据的场景中。atomic操作可以保证即使多个gpu同时对同一内存地址进行操作,每个操作也都能在没有其他操作干扰的情况下正确执行。它们在多gpu训练和并行计算中非常有用,尤其是在需要累积梯度、更新参数或者实现某些同步机制时。例如,在多gpu训练一个深度神经网络时,每个gpu可能会计算一部分梯度,然后需要将这些梯度汇总到一个全局的梯度中。使用atomic指令可以确保在更新全局梯度时,不同gpu计算的梯度能够正确地累加,而不会发生
...【技术保护点】
1.一种支持多GPU Atomic指令操作的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的支持多GPU Atomic指令操作的方法,其特征在于:所述S1中,用户需要多GPU共同完成一个任务,发送任务给GPU。
3.根据权利要求1所述的支持多GPU Atomic指令操作的方法,其特征在于:所述S2中,支持的Atomic类型包括但不限于逻辑运算、加法、减法、乘法、自加1、自减1、最大值、最小值、替换、比较操作;以及支持自定义的数据位宽,包括但不限于4bit、8bit、16bit、32bit、64bit、128bit数据大小。
【技术特征摘要】
1.一种支持多gpu atomic指令操作的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的支持多gpu atomic指令操作的方法,其特征在于:所述s1中,用户需要多gpu共同完成一个任务,发送任务给gpu。
3.根据权利要求1所述的支持多gpu atomic指令操作的方法,其特征在于:所述s2中,支持的atomic类型包括但不限于逻辑运算、加法、减法、乘法、自加1、自减1、最大值、最小值、替换、比较操作;以及支持自定义的数据位宽,包括但不限于4bit、8bit、16bit、32bit、64bit、128bit数据大小。
4.根据权利要求1所述的支持多gpu atomic指令操作的方法,其特征在于:所述s5用于根据指令操作码从pcie tlp中获取atomic指令的地址及数据,同时传输到本地的执行模块。
5.根据权利要求1所述的支持多gpu atomic指令操作的方法,其特征在于:所...
【专利技术属性】
技术研发人员:王爽,李学清,杨华中,杨冬,李宗鹏,请求不公布姓名,
申请(专利权)人:沐曦集成电路上海股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。