A unified GPU staining debugging processing array structure, bus interface unit, between the GPU and the host was the task scheduling unit, a plurality of uniform dyeing control and status registers in the array and a plurality of stainers cluster program entrance register contains, and access to a unified internal local memory array stained window access control logic. Based on the above functional unit, the invention can be continuously injected to the unified array staining does not exceed any maximum number of tasks a plurality of dyeing tasks; each type of dyeing tasks can be arbitrarily designated; handling different kinds of dyeing tasks can be arbitrarily designated; processing results can be obtained for all host dyeing tasks.
【技术实现步骤摘要】
一种GPU统一染色处理阵列的调试结构
本专利技术涉及计算机硬件
,尤其涉及GPU统一染色处理阵列的调试结构。
技术介绍
随着图形化应用的不断增加,早期单靠CPU进行图形绘制的解决方案已经难以满足成绩和技术增长的图形处理需求,图形处理器(GraphicProcessingUnit,GPU)应运而生。从1999年Nvidia发布第一款GPU产品至今,GPU技术的发展主要经历了固定功能流水线阶段、分离染色器架构阶段、统一染色器架构阶段,其图形处理能力不断提升,应用领域也从最初的图形绘制逐步扩展到通用计算领域。GPU流水线高速、并行的特征和灵活的可编程能力,为图形处理和通用并行计算提供了良好的运行平台。目前,我国尚无基于统一染色架构的GPU,各领域显示控制系统中大量采用国外进口的商用GPU芯片。尤其是在军用领域中,国外进口商用GPU芯片存在温度和环境适应性差、无法保证电路本身或配套软件没有“后门”、包含大量军用领域不需要的冗余功能单元,功耗指标无法满足要求、商用GPU芯片更新换代快,随时面临停产、断档,难以满足武器装备持续保障等缺陷,在安全性、可靠性、保障性等方面的存在重大隐患。而且,出于政治、军事、经济等原因,国外对我国实行技术“封锁”和产品“垄断”,难以获得GPU芯片的底层技术资料,如寄存器资料、详细内部微架构、核心软件源码等,导致GPU功能、性能无法充分发挥,且移植性较差;上述问题严重制约了我国显示系统的独立研制和自主发展。尤其是GPU统一染色阵列调试机制,是GPU图形处理流水线微架构的核心设计与验证技术,突破GPU统一染色阵列调试关键技术,研制高性能 ...
【技术保护点】
一种GPU统一染色处理阵列的调试结构,其特征在于,包括:包含GPU与主机之间的总线接口单元(1)(PCIe EP)、染色任务调度单元(2)、多个统一染色阵列中的控制和状态寄存器(3)(CSR,Control and Status Register)、多个染色器簇程序入口寄存器(4)(SPE,Shader Program Entry),以及对统一染色阵列内部局部存储器进行访问的窗口访问控制逻辑(5);主机通过总线接口单元(1)配置染色任务调度单元(2),确定染色任务的调度模式,即每个染色任务中多个独立顶点和像素的MASK标识和染色任务在SSC中的位置信息;主机通过总线接口单元(1)配置控制和状态寄存器(3),确定统一染色阵列中多个SSC的工作模式;主机通过总线接口单元(1)配置染色器簇程序入口寄存器(4),确定统一染色阵列中多个SSC执行染色程序时的入口地址;主机通过总线接口单元(1)配置窗口访问控制逻辑(5),确定窗口控制逻辑的工作模式;主机通过总线接口单元(1)根据染色任务调度单元(2)中的调度模式信息,通过访问窗口访问控制逻辑(5)中的地址窗口寄存器和数据窗口寄存器将要调试的染色任 ...
【技术特征摘要】
1.一种GPU统一染色处理阵列的调试结构,其特征在于,包括:包含GPU与主机之间的总线接口单元(1)(PCIeEP)、染色任务调度单元(2)、多个统一染色阵列中的控制和状态寄存器(3)(CSR,ControlandStatusRegister)、多个染色器簇程序入口寄存器(4)(SPE,ShaderProgramEntry),以及对统一染色阵列内部局部存储器进行访问的窗口访问控制逻辑(5);主机通过总线接口单元(1)配置染色任务调度单元(2),确定染色任务的调度模式,即每个染色任务中多个独立顶点和像素的MASK标识和染色任务在SSC中的位置信息;主机通过总线接口单元(1)配置控制和状态寄存器(3),确定统一染色阵列中多个SSC的工作模式;主机通过总线接口单元(1)配置染色器簇程序入口寄存器(4),确定统一染色阵列中多个SSC执行染色程序时的入口地址;主机通过总线接口单元(1)配置窗口访问控制逻辑(5),确定窗口控制逻辑的工作模式;主机通过总线接口单元(1)根据染色任务调度单元(2)中的调度模式信息,通过访问窗口访问控制逻辑(5)中的地址窗口寄存器和数据窗口寄存器将要调试的染色任务数据送入统一染色阵列中不同的SSC中,调试准备工作结束;统一染色阵列根据控制和状态寄存器(3)和染色器簇程序入口寄存器(4)并行执行染色程序,并将执行结果写入染色器内核的存储器中;主机通过总线接口单元(1)通过访问窗口访问控制逻辑(5)中的地址窗口寄存器和数据窗口寄存器将调试的染色任务的执行结果从染色器内核的存储器中读回主机,调试工作结束。2.如权利要求1所述的一种GPU统一染色处理阵列的调试结构,其特征在于,所述GPU与主机之间的总线接口单元(1)能够对染色任务调度单元(2)、窗口访问控制逻辑(5),以及多个染色器簇程序入口寄存器(4)进行配置访问。3.如权利要求1所述的一种GPU统一染色处理阵列的调试结构,其特征在于,所述染色任务调度单元(2)进行顶点和像素染色任务的调度,至少包括对顶点和像素染色任务属性数据的传输,以及对染色任务类型、任务掩码和数据准备好标识的设置。4.如权利要求1所述的一种GPU统一染色处理阵列的调试结构,其特征在于,所述统一染色阵列中的控制和状态寄存器(3)包含一组寄存器,用来存储统一染色阵列中某个染色器簇的控制和状态信息,至少包括在当前染色器簇上运行的所有染色任务的类型、所有染色任务的掩码、数据准备好标识,以及染色任务执行完成标志。5.如权利要求1所述...
【专利技术属性】
技术研发人员:张骏,田泽,任向隆,韩立敏,郑新建,牛少平,
申请(专利权)人:中国航空工业集团公司西安航空计算技术研究所,
类型:发明
国别省市:陕西,61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。