【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
1、加速处理单元(apu)被设计为有效地并行执行数千个进程(计算任务或内核)。典型的应用程序可涉及必须按顺序执行的进程以及可被并行化的进程。因此,应用程序软件架构可包括可被设计成在中央处理单元(cpu)上运行的顺序零件以及可被设计成在加速器(包括apu或apu群集)上运行的能够并行的零件,以实现由群集提供的高性能。然而,由于在cpu上执行的进程对在apu上执行的工作(诸如内核的同步和启动)进行管理,所以cpu-apu通信带来了显著的延迟。此类延迟对于大规模高性能计算(hpc)应用程序尤其重要,其中具有小工作负载的大量内核由cpu进行管理。在此类情况下,cpu在同步和启动内核中所花费的时间可比得上或甚至超过内核自身的执行时间。此外,在运行时期间发生的内核之间的依赖关系的变化可进一步造成与cpu-apu通信有关的延迟,因为这需要cpu中断运行时操作以便调整同步方案。需要减少cpu-apu通信有关的延迟的技术。
技术实现思路
【技术保护点】
1.一种用于由加速器驻留管理器进行运行时管理的方法,所述方法包括:
2.根据权利要求1所述的方法,所述方法进一步包括:
3.根据权利要求2所述的方法,所述方法进一步包括:
4.根据权利要求1所述的方法,所述方法进一步包括:
5.根据权利要求4所述的方法,所述方法进一步包括:
6.根据权利要求1所述的方法,所述方法进一步包括:
7.根据权利要求1所述的方法,其中:
8.根据权利要求7所述的方法,其中:
9.根据权利要求1所述的方法,其中所述表示为图形,并且其中:
...
【技术特征摘要】
【国外来华专利技术】
1.一种用于由加速器驻留管理器进行运行时管理的方法,所述方法包括:
2.根据权利要求1所述的方法,所述方法进一步包括:
3.根据权利要求2所述的方法,所述方法进一步包括:
4.根据权利要求1所述的方法,所述方法进一步包括:
5.根据权利要求4所述的方法,所述方法进一步包括:
6.根据权利要求1所述的方法,所述方法进一步包括:
7.根据权利要求1所述的方法,其中:
8.根据权利要求7所述的方法,其中:
9.根据权利要求1所述的方法,其中所述表示为图形,并且其中:
10.根据权利要求9所述的方法,其中所述图形的每个节点与计时器相关联,所述计时器测量与所述节点相关联的内核的执行时间。
11.一种用于由加速器驻留管理器进行...
【专利技术属性】
技术研发人员:尼古拉斯·詹姆斯·柯蒂斯,
申请(专利权)人:超威半导体公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。