交叉执行的增强型标量向量双管线架构制造技术

技术编号:24409091 阅读:35 留言:0更新日期:2020-06-06 08:23
本发明专利技术的实施例可以通过识别标量指令与向量指令集来提供技术解决方案。标量指令与向量指令集可以设置成在内核中执行。将所述标量指令与向量指令集的标量指令与预定义的标量指令集进行比较。基于所述比较,为所述标量指令生成二级标量管线以用于处理。将来自所述标量指令与向量指令集的剩余标量指令分配给第一标量管线。将所述标量指令与向量指令集的向量指令分配到向量管线。

Enhanced scalar vector double pipeline architecture of cross execution

【技术实现步骤摘要】
交叉执行的增强型标量向量双管线架构
本专利技术的实施例大体上涉及提供增强型管线构造以便进行更快速的标量处理。
技术介绍
标量处理一次仅处理一个数据项,典型数据项是整数或浮点数。通常,标量处理被分类为SISD处理(单指令,单数据)。此方法的另一变化是单指令、多线程(SIMT)处理。传统的SIMT多线程处理器通过将线程组织成组并在单独的处理管线、标量或向量管线上执行每个线程来提供多个线程的并行执行。在单个周期中调度由一个组中的线程执行的指令。生成处理管线控制信号,使得当线程跨越处理管线的各级时,组中的所有线程执行一组类似的操作。例如,一组中的所有线程从寄存器文件读取源操作数,执行处理单元中的指定算术运算,并将结果写回到寄存器文件。当在处理器中支持多个语境时,SIMT需要额外存储器用于复制同一内核中使用的恒定值。因而,当从主存储器或高速缓冲存储器加载不同恒定值时,引入等待时间开销。虽然标量管线和向量管线对于并行处理是有利的,但这种配置可能对标量比重较大(scalar-heavy)的指令或操作数产生额外的等待时间。另外,由于频繁上下文切换以及与本文档来自技高网...

【技术保护点】
1.一种用于生成二级标量管线的计算机实现的方法,所述计算机实现的方法包括:/n识别标量指令与向量指令集,所述标量指令与向量指令集在内核中执行;/n利用预定义的标量指令集来确定所述标量指令与向量指令集的标量指令;/n响应于所述确定是肯定的,为所述标量指令生成二级标量管线以用于处理;/n将来自所述标量指令与向量指令集的剩余标量指令分配到第一标量管线;/n将所述标量指令与向量指令集的向量指令分配到向量管线;以及/n初始化所述内核以用于执行。/n

【技术特征摘要】
20190220 US US16/2810541.一种用于生成二级标量管线的计算机实现的方法,所述计算机实现的方法包括:
识别标量指令与向量指令集,所述标量指令与向量指令集在内核中执行;
利用预定义的标量指令集来确定所述标量指令与向量指令集的标量指令;
响应于所述确定是肯定的,为所述标量指令生成二级标量管线以用于处理;
将来自所述标量指令与向量指令集的剩余标量指令分配到第一标量管线;
将所述标量指令与向量指令集的向量指令分配到向量管线;以及
初始化所述内核以用于执行。


2.根据权利要求1所述的计算机实现的方法,其中,所述标量指令与向量指令集被配置为并行执行。


3.根据权利要求1所述的计算机实现的方法,还包括在所述第一标量管线中优先处理所分配的标量指令。


4.根据权利要求3所述的计算机实现的方法,还包括为优先处理的标量指令分配优先标志。


5.根据权利要求1所述的计算机实现的方法,其中,所述第一标量管线包括大多数标量寄存器。


6.根据权利要求1所述的计算机实现的方法,其中,所述二级标量管线包括标量寄存器的子集。


7.一种用于生成二级标量管线的图形处理子系统,所述图形处理子系统包括:
图形处理单元(GPU),所述图形处理单元可操作以:
识别标量指令与向量指令集,所述标量指令与向量指令集在内核中执行;
利用预定义的标量指令集来确定所述标量指令与向量指令集的标量指令;
响应于所述确定是肯定的,为所述标量指令生成二级标量管线以用于处理;
将来自所述标量指令与向量指令集的剩余标量指令分配到第一标量管线;
将所述标量指令与向量指令集的向量指令分配到向量管线;以及
初始化所述内核以用于执行。

【专利技术属性】
技术研发人员:邵平平骆培李成
申请(专利权)人:上海天数智芯半导体有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1