【技术实现步骤摘要】
GPU中一种染色片段调度管理的硬件加速实现方法
本专利技术涉及的是GPU设计领域,具体涉及GPU中一种染色片段调度管理的硬件加速实现方法。
技术介绍
染色片段的调度管理是可编程流水线设计实现的GPU中一个重要问题。它的快慢直接影响了像素染色器的效率,从而影响了整个图形管线或者图像管线输出像素的快慢。传统调度染色片段方法采用调度固定行,并通过总线仲裁实现1对1的调度。这样实现的缺点是:1、传统调度方式未考虑处理器线程使用情况,调度完成数据通过总线仲裁方式完成调度从而给总线带来压力,出现总线频繁请求导致切换带来的功耗问题,并且调度效率低下。2、由于光栅化后输出的染色片段的每一行数据根据图元的不同,数据量大小不同,同时处理器对不同数据的处理时间存在差异。如果采用最后通过总线仲裁方式完成调度,会导致每一个处理器的使用没有达到100%,最终导致处理器内部线程过饱和,有的处理器线程过饥饿,从而导致像素染色效率低下。综上所述,本专利技术设计了GPU中一种染色片段调度管理的硬件加速实现方法。
技术实现思路
针对现有技术上存在的不足,本专利技术目的是在于提供GPU中一种染色片段调度管理 ...
【技术保护点】
1.GPU中一种染色片段调度管理的硬件加速实现方法,其特征在于,包括以下步骤:(1)、染色片段的寄存器配置;(2)、预判控制;(3)、输入数据打包;(4)、存储控制;(5)、输出数据解包;(6)、状态控制;所述的步骤(1)为了实现将光栅化后两个通道内的数据调度到一个CCU中的四个GCU中,同时完成两个GCU处理一个通道数据;并且为了避免调度后的片断数据经过像素染色处理后输出出现先后顺序颠倒问题,约定通道0的数据调度到GCU0和GCU2,通道1的数据调度到GCU1和GCU3,调度管理器中的寄存器配置模块可以完成根据处理器的处理能力不同而调整调度管理器的工作参数,以最大发挥处理 ...
【技术特征摘要】
1.GPU中一种染色片段调度管理的硬件加速实现方法,其特征在于,包括以下步骤:(1)、染色片段的寄存器配置;(2)、预判控制;(3)、输入数据打包;(4)、存储控制;(5)、输出数据解包;(6)、状态控制;所述的步骤(1)为了实现将光栅化后两个通道内的数据调度到一个CCU中的四个GCU中,同时完成两个GCU处理一个通道数据;并且为了避免调度后的片断数据经过像素染色处理后输出出现先后顺序颠倒问题,约定通道0的数据调度到GCU0和GCU2,通道1的数据调度到GCU1和GCU3,调度管理器中的寄存器配置模块可以完成根据处理器的处理能力不同而调整调度管理器的工作参数,以最大发挥处理器的能力;所述的步骤(2)采用预判控制模块,所述的预判控制模块需要根据光栅化输出的数据的坐标X值以及对应数据属性0来判断这是数据的第一个,并检测该X值参数,具体数值可以根据调度管理器重寄存器配置模块来同步调整,如果处理器的最大工作线程为16,那么需要检测X值对应的第4位来判断应该将该片段调度到哪一个处理器中;所述的步骤(3)采用输入数据打包单元,完成统计输入到每一个存储FIFO模块中的光栅化片段的数量,每当检测到数据属性为0时,数据个数就加1,如果检测到数据个数已经满足了接收从坐标开始所带属性数据的处理器最大线程调度单位的数据后,就停止接收光栅化的数据,并将最后一个数据多发送一次作为结束标记;所述的步骤(4)采用存储控制模块,存储控制模块的内部设计4个同步FIFO,一方面可以存放指定到GCU0、GCU1、GCU2、GCU3的数据,同时可以提高光栅化的工作效率,不至于调度缓慢而导致光栅化停止;所述的步骤(5)采用状态控制模块,根据CCU单元的空闲状态ready信号以及四个处理器GCU的state忙闲状态,采用轮训方案...
【专利技术属性】
技术研发人员:吴兴涛,
申请(专利权)人:芯视图常州微电子有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。