【技术实现步骤摘要】
本专利技术涉及gpu(图形处理单元)内的调度方法,其中从程序中提取指令突发,使得它们可以被单独地调度和执行。本专利技术还涉及被设计成执行这些指令突发的gpu硬件。
技术介绍
1、gpu中的寄存器堆(register file)用于存储由执行核心(例如,由着色器核心内的算术逻辑单元alu)执行的操作的操作数。这些寄存器堆在gpu内的sram(静态随机存取存储器)中实现,sram比用作主存储器(例如,片外存储器)的dram(动态随机存取存储器)更具功率和面积效率。gpu需要大容量的寄存器堆以支持大量的并行线程。当线程由于某种原因(例如,由于执行存储器访问时的延迟)而无法进行时,gpu在正在运行的线程之间切换,但这需要在每个指令结束时将数据保存到寄存器堆。
2、下面描述的实施例仅通过示例的方式提供,并且不限制解决已知gpu硬件和gpu调度方法的任何或所有缺点的实现方式。
技术实现思路
1、提供本概述来以简化的形式引入下面在详细描述中进一步描述的一些挑选出的概念。本概述不意图示出要求保
...【技术保护点】
1.一种编译程序的计算机实现的方法,包括:
2.根据权利要求1所述的方法,其中,所述能够原子地执行的一组指令包括不具有在执行该组中的指令期间需要解析的任何外部依赖的指令。
3.根据权利要求1所述的方法,其中,所识别的能够原子地执行的一组指令包括一组相互依赖的指令。
4.根据权利要求1所述的方法,还包括:
5.根据权利要求1所述的方法,还包括:
6.根据权利要求1所述的方法,还包括:
7.根据权利要求6所述的方法,其中,修改所述两个连续指令中的第二指令以指示源操作数经由转发路径可用包括:
【技术特征摘要】
1.一种编译程序的计算机实现的方法,包括:
2.根据权利要求1所述的方法,其中,所述能够原子地执行的一组指令包括不具有在执行该组中的指令期间需要解析的任何外部依赖的指令。
3.根据权利要求1所述的方法,其中,所识别的能够原子地执行的一组指令包括一组相互依赖的指令。
4.根据权利要求1所述的方法,还包括:
5.根据权利要求1所述的方法,还包括:
6.根据权利要求1所述的方法,还包括:
7.根据权利要求6所述的方法,其中,修改所述两个连续指令中的第二指令以指示源操作数经由转发路径可用包括:
8.根据权利要...
【专利技术属性】
技术研发人员:A·德梅尔,W·托马斯,大卫·柳西,马克·谢泼德,
申请(专利权)人:想象技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。