数据处理方法、图像处理器GPU及第一节点设备技术

技术编号:9116830 阅读:167 留言:0更新日期:2013-09-05 06:05
本发明专利技术实施例提供了一种数据处理方法、图像处理器GPU及第一节点设备,涉及通信技术领域,所述数据处理方法包括:当CPU启动本节点设备的GPU的内核程序时,GPU运行内核程序,内核程序包括至少一个预设的GPU通信API;当GPU的内核程序运行至预设的GPU通信API时,GPU获取第一通信数据;GPU判断预设的GPU通信API对应的通信操作是用于发送的通信操作还是用于接收的通信操作,如果是用于发送的通信操作时,GPU将第一通信数据存储至显存的预设的缓冲区,使CPU将第一通信数据由预设的缓冲区复制至本节点设备的内存中;如果是用于接收的通信操作时,GPU从预设的缓冲区获取第二通信数据。本发明专利技术提高了系统的计算效率。

【技术实现步骤摘要】
【国外来华专利技术】数据处理方法、图像处理器GPU及第一节点设备
本专利技术涉及通信
,特别涉及一种数据处理方法、图像处理器GPU及第一节点设备。
技术介绍
在分布式环境下,节点设备之间的数据通信机制是分布式并行计算的基础。在典型的分布式并行计算系统中,同属一个任务的各个进程之间存在一定的共享数据或数据流动,这些进程需要在特定位置进行同步。当在节点设备中加入GPU(GraphicProcessingUnit,图形处理器),就组成了分布式GPU系统。在分布式GPU系统中,同属一个任务的各个进程由不同节点设备的GPU分别运行,其中节点设备可以为商用服务器;由于各个进程之间存在一定的共享数据,因此需要节点间的通信机制来实现所述共享数据的流动。例如当第一节点设备的GPU1的第一进程需要共享第二节点设备的GPU2的第二进程的通信数据时,由于GPU的从处理器特性,第二节点设备的CPU(CentralProcessingUnit,中央处理器)2在所述GPU2运行完第二进程后,将所述通信数据复制到自身内存后经第一节点设备的CPU1传输至所述GPU1,使所述GPU1执行第一进程的处理过程。在实现本专利技术的过程中,本文档来自技高网...
数据处理方法、图像处理器GPU及第一节点设备

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种数据处理方法,其特征在于,所述方法包括:当第一节点设备的中央处理器CPU启动本节点设备的图形处理器GPU的内核程序时,所述本节点设备的GPU运行所述内核程序,所述内核程序包括至少一个预设的GPU通信应用程序编程接口API;当所述本节点设备的GPU的内核程序运行至所述预设的GPU通信API时,所述本节点设备的GPU获取第一通信数据;所述本节点设备的GPU判断所述预设的GPU通信API对应的通信操作是用于发送的通信操作还是用于接收的通信操作,如果是用于发送的通信操作时,所述本节点设备的GPU将所述第一通信数据存储至本节点设备的显存的预设的缓冲区,使所述第一节点设备的CPU将所述第一通信数据由所述预设的缓冲区复制至本节点设备的内存中,并由所述第一节点设备的CPU将所述第一通信数据经第二节点设备的CPU传输至所述第二节点设备的GPU;如果是用于接收的通信操作时,所述本节点设备的GPU从所述预设的缓冲区获取第二通信数据,其中所述第二通信数据由所述第一节点设备的CPU复制至所述预设的缓冲区中,所述第二通信数据是所述第二节点设备上的GPU的内核程序生成的第二通信数据。2.根据权利要求1所述的方法,其特征在于,所述内核程序包括至少两个子内核程序,每两个子内核程序之间存在一个所述预设的GPU通信API。3.根据权利要求2所述的方法,其特征在于,所述本节点设备的GPU获取第一通信数据包括:所述本节点设备的GPU获取所述子内核程序的通信数据。4.根据权利要求1所述的方法,其特征在于,所述预设的缓冲区包括标示信号位和通信数据缓冲区;所述标示信号位包括第一标示信号位和第二标示信号位,所述通信数据缓冲区包括第一通信数据缓冲区和第二通信数据缓冲区,其中所述第一标示信号位和所述第一通信数据缓冲区对应于所述用于发送的通信操作,所述第二标示信号位和所述第二通信数据缓冲区对应于所述用于接收的通信操作。5.根据权利要求4所述的方法,其特征在于,所述本节点设备的GPU将所述第一通信数据存储至本节点设备的显存的预设的缓冲区,使所述第一节点设备的CPU将所述第一通信数据由所述预设的缓冲区复制至本节点设备的内存中包括:所述本节点设备的GPU将所述第一通信数据存储至本节点设备的显存的第一通信数据缓冲区,设置所述第一标示信号位的状态为置位状态,使所述第一节点设备的CPU在查询到所述第一标示信号位的状态为置位状态后将所述第一通信数据缓冲区中的第一通信数据复制至本节点设备的内存中。6.根据权利要求4所述的方法,其特征在于,所述本节点设备的GPU从所述预设的缓冲区获取第二通信数据,其中所述第二通信数据由所述第一节点设备的CPU复制至所述预设的缓冲区中包括:当本节点设备的GPU查询到所述第二标示信号位的状态为置位状态时,所述本节点设备的GPU从所述第二通信数据缓冲区中获取第二通信数据,其中所述第二通信数据由所述第一节点设备的CPU复制至所述第二通信数据缓冲区中,所述第二标示信号位的状态由所述第一节点设备的CPU设置为置位状态。7.根据权利要求6所述的方法,其特征在于,所述本节点设备的GPU从所述第二通信数据缓冲区中获取所述第二通信数据之后,进一步包括:所述本节点设备的GPU检验所述第二通信数据是否有效,如果是,将所述第二标示信号位的状态设置为复位状态;如果否,将所述第二标示信号位的状态设置为接收错误状态。8.根据权利要求1-7任一项所述的方法,其特征在于,进一步包括:所述第一节点设备的CPU将所述第一通信数据经第二节点设备的CPU传输至所述第二节点设备的GPU,使所述第二节点设备的GPU共享所述第一通信数据。9.一种图形处理器GPU,其特征在于,包括:运行模块,用于当第一节点设备的中央处理器CPU启动本节点...

【专利技术属性】
技术研发人员:蒋吴军卢彦超郑龙过敏意
申请(专利权)人:华为技术有限公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1