【技术实现步骤摘要】
【国外来华专利技术】用于混合系统的分布式功能执行的方法、系统及介质
本公开通常涉及分布式功能执行,更具体地说,涉及用于使用OpenCL的混合系统的分布式功能执行。
技术介绍
开放计算语言(OpenCL)是用于编写跨越包括CPU、图形处理单元(GPU)和其它处理器的异构平台而执行的程序的框架。OpenCL包括用于写内核(其作为在OpenCL设备上执行的功能)以及API(其用于定义并且然后控制平台)的语言。OpenCL使用基于任务和基于数据的并行性来提供并行计算。OpenCL被设计为提供用于非图形计算的对图形处理单元的应用访问,并且由此将GPU的能力扩展超出图形。当前的OpenCL运行时间环境不可用于与特定架构(例如IBM的Systemz)一起使用。为了这些架构利用OpenCL,架构必须远程访问分离架构上的OpenCL运行时间。在zEnterprise配置中,Systemz主机可以调用通常被称为加速器的另一设备上的计算密集功能(computation-allyintensivefunction)。为了zOS地址空间或zLinux处理访问OpenCL主机程序中的API,可以使用远程过程调用(RPC)方案。然而,结合OpenCL使用当前可用的RPC方案存在若干缺陷。由于OpenCL被设计为与非分布式系统一起使用,因此OpenCL未被设计为优化各种处理器与系统中的设备所使用的缓冲器之间的数据传输。
技术实现思路
根据本公开的一个实施例,一种用于混合系统上的分布式功能执行的方法,包括:通过包括一个或多个处理器的主机处理应用;将所述应用的至少部分分布到加速器,以用于执行。所述方法包括:指令所述 ...
【技术保护点】
一种方法,包括:通过包括一个或多个处理器的主机来处理应用;将所述应用的至少部分分布到加速器,以用于执行;指令所述加速器在所述加速器上创建缓冲器;指令所述加速器执行所述应用的部分,其中,所述加速器将数据写入到所述缓冲器;以及在所述应用请求所述缓冲器中的数据之前,指令所述加速器将所述缓冲器中的数据发送到所述主机;其中,所述加速器基于所述主机中的一个或多个运行时间条件在将数据发送到所述主机之前聚合所述缓冲器中的数据。
【技术特征摘要】
【国外来华专利技术】2012.01.25 US 13/357,6501.一种用于分布式功能执行的方法,包括:通过包括一个或多个处理器的主机来处理应用,其中所述主机包括数据管理和调度库;将所述应用的至少部分分布到加速器,以用于执行,其中所述加速器包括开放计算语言加速器运行时间环境,该开放计算语言加速器运行时间环境充当所述主机的代理;指令所述加速器在所述加速器上创建缓冲器;指令所述加速器执行所述应用的部分,其中,所述加速器将数据写入到所述缓冲器;以及在所述应用请求所述缓冲器中的数据之前,指令所述加速器将所述缓冲器中的至少部分数据发送到所述主机;其中,所述数据管理和调度库指令所述加速器基于所述主机中的一个或多个运行时间条件在将所述至少部分数据发送到所述主机之前聚合所述缓冲器中的所述至少部分数据,其中主机中的该一个或多个运行时间条件包括在缓冲器中的所述至少部分数据是否在该应用执行期间将由所述主机读取。2.如权利要求1所述的方法,其中,所述加速器上的缓冲器包括作为只读、只写或读写的指定。3.如权利要求2所述的方法,其中,如果所述缓冲器指定为只读,则所述加速器不将所述缓冲器中的所述至少部分数据发送到所述主机。4.如权利要求1所述的方法,其中,指令所述加速器将所述缓冲器中的所述至少部分数据发送到所述主机还包括:为所述加速器提供最小传输值;指令所述加速器聚合所述的缓冲器中的所述至少部分数据;以及当所述缓冲器的大小超过所述最小传输值时,指令所述加速器发送所述缓冲器中的所述至少部分数据。5.如权利要求1所述的方法,其中,所述应用的部分包括计算循环,并且其中,指令所述加速器将所述缓冲器中的所述至少部分数据发送到所述主机还包括在完成计算循环时,指令所述加速器将所述缓冲器中的数据发送到所述主机。6.如权利要求1所述的方法,其中,指令所述加速器将所述缓冲器中的数据发送到所述主机还包括:为所述加速器提供传输时段;指令所述加速器聚合所述缓冲器中的数据;以及在所述传输时段期间,指令加速器不多于一次将所述缓冲器中的数据发送到所述主机。7.如权利要求1所述的方法,还包括:将用于执行所述应用的部分的应用数据写入到所述加速器上的所述缓冲器;其中,所述主机聚合从所述主机发送到所述加速器的数据,以隐藏在构成数据的单独传送期间所导致的通信等待时间。8.一种用于分布式功能执行的计算机可读存储介质,该存储介质存储有被配置为执行以下操作的计算机可读程序代码:处理主机上的应用,其中所述主机包括数据管理和调度库;将所述应用的至少部分分布到加速器,以用于执行,其中所述加速器包括开放计算语言加速器运行时间环境,该开放计算语言加速器运行时间环境充当所述主机的代理;指令所述加速器在所述加速器上创建缓冲器;指令所述加速器执行所述应用的部分,其中,所述加速器将数据写入到所述缓冲器;以及在所述应用请求所述缓冲器中的数据之前,指令所述加速器将所述缓冲器中的至少部分数据发送到所述主机;其中,所述数据管理和调度库指令所述加速器基于所述主机中的一个或多个运行时间条件在将所述至少部分数据发送到所述主机之前聚合所述缓冲器中的所述至少部分数据,其中主机中的该一个或多个运行时间条件包括在缓冲器中的所述至少部分数据是否在该应用执行期间将由所述主机读取。9.如权利要求8所述的计算机可读存储介质,其中,所述加速器上的缓冲器包括作为只读、只写或读写的指定。10.如权利要求9所述的计算机可读存储介质,...
【专利技术属性】
技术研发人员:DG查普曼,RB克里什纳莫西,CJ帕里斯,DW施米特,BP塞加尔,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。