【技术实现步骤摘要】
用于加速延迟敏感算法的恒定标量寄存器架构
本专利技术的实施例大体上涉及标量处理。
技术介绍
标量处理一次仅处理一个数据项,典型数据项是整数或浮点数。通常,标量处理被分类为SISD处理(单指令,单数据)。此方法的另一变化是单指令、多线程(SIMT)处理。传统的SIMT多线程处理器通过将线程组织成组并在单独的处理管线上执行每个线程来提供多个线程的并行执行。在单个周期中调度由一个组中的线程执行的指令。生成处理管线控制信号,使得当线程跨越处理管线的各级时,组中的所有线程执行一组类似的操作。例如,一组中的所有线程从寄存器文件读取源操作数,执行处理单元中的指定算术运算,并将结果写回到寄存器文件。当在处理器中支持多个语境时,SIMT需要额外存储器用于复制同一内核中使用的恒定值。因而,当从主存储器或高速缓冲存储器加载不同恒定值时,引入等待时间开销。然而,在需要高性能的情况下,期望减少等待时间和重复。因此,本专利技术的实施例试图解决或应对上文所指出的一个或多个技术问题。
技术实现思路
本专利技术的实施例可以 ...
【技术保护点】
1.一种图形处理子系统,包括:/n图形处理单元(GPU),所述图形处理单元可操作以:/n识别与所述GPU相关联的标量寄存器文件,所述标量寄存器文件具有标量寄存器分配总数;/n识别标量处理所需的单元以用于内核执行;/n分配所述标量寄存器文件中的标量寄存器以用于所述内核执行;/n从所述标量寄存器分配总数识别所述标量寄存器文件中剩余的未使用单元;/n分配所述标量寄存器文件中剩余的未使用单元的标量寄存器以存储用于所述内核执行的恒定标量值;/n在所述内核执行之前,初始化所述标量寄存器文件;以及/n启动所述内核执行。/n
【技术特征摘要】
20190220 US US16/2810521.一种图形处理子系统,包括:
图形处理单元(GPU),所述图形处理单元可操作以:
识别与所述GPU相关联的标量寄存器文件,所述标量寄存器文件具有标量寄存器分配总数;
识别标量处理所需的单元以用于内核执行;
分配所述标量寄存器文件中的标量寄存器以用于所述内核执行;
从所述标量寄存器分配总数识别所述标量寄存器文件中剩余的未使用单元;
分配所述标量寄存器文件中剩余的未使用单元的标量寄存器以存储用于所述内核执行的恒定标量值;
在所述内核执行之前,初始化所述标量寄存器文件;以及
启动所述内核执行。
2.根据权利要求1所述的图形处理子系统,还包括在完成所述内核执行时,在下一内核执行之前,回收所述未使用单元。
3.根据权利要求1所述的图形处理子系统,其中,分配所述标量寄存器文件中的标量寄存器以用于所述内核执行包括分配所述标量寄存器文件中的标量寄存器以用于所述内核执行的一个或多个线程。
4.一种由图形处理单元处理的计算机实现的方法,所述方法包括:
识别与GPU相关联的标量寄存器文件,所述标量寄存器文件具有标量寄存器分配总数;
识别标量处理所需的单元以用于内核执行;
分配所述标量寄存器文件中的标量寄存器以用于所述内核执行;
从所述标量寄存器分配总数识别所述标量寄存器文件中剩余的未使用单元;
分配所述标量寄存器文件中剩余的未使用单元的标量寄存器以存储用于所述内核执行的恒定标量值;
在所述内核执行之前,初始化所述标量寄存器文件;以及
...
【专利技术属性】
技术研发人员:邵平平,骆培,李成,
申请(专利权)人:上海天数智芯半导体有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。