图元数据的装载控制方法、图形处理器、设备及存储介质技术

技术编号:36932913 阅读:18 留言:0更新日期:2023-03-22 18:55
本发明专利技术公开了一种图元数据的装载控制方法、图形处理器、设备及存储介质。该方法由图形处理器中的图元装载器执行,包括:从图形处理器中的线程构造器处获取输出顶点流;对输出顶点流中的各顶点进行属性缓存命中测试,并根据测试结果,形成携带命中描述信息的扩展顶点流;将扩展顶点流装载得到扩展图元顶点流,并将扩展图元顶点流发送至图形处理器中的顶点数据收集器。本发明专利技术的技术方案对线程构造器输出的输出顶点流首先做属性缓存命中测试,再进行图元装载,可以在线程保持运行,顶点数据尚未被写入顶点数据缓冲区的情况下对输出顶点做命中测试,减少了属性缓存命中测试的无效重复次数,避免了图元装载器出现空载的情况,提高了GPU工作效率。高了GPU工作效率。高了GPU工作效率。

【技术实现步骤摘要】
图元数据的装载控制方法、图形处理器、设备及存储介质


[0001]本专利技术涉及图像处理
,尤其涉及一种图元数据的装载控制方法、图形处理器、设备及存储介质。

技术介绍

[0002]目前图形处理器(graphics processing unit,GPU)图形渲染流水线中,前端着色器(shader)通常包含有顶点着色器(Vertex Shader,VS)、外壳着色器(Hull Shader,HS)、域着色器(DominShader,DS)和几何着色器(Geometry Shader,GS)等,这些前端着色器运算完成后都会输出顶点数据,图元装载器负责把输出顶点流装载成图元顶点流。
[0003]图元装载器的主要包括两个功能模块,图元装载模块和属性缓存命中测试模块。图元装载模块,用于将顶点流装载得到图元顶点流,之后交由属性缓存命中测试模块对图元顶点流中的每个顶点做属性缓存命中测试,进而,图元装载器最终输出携带有各顶点的属性缓存命中测试结果的图元顶点流。
[0004]现有技术在将输出顶点流装载得到图元顶点流的过程,是需要对同一顶点进行多次复用的。例如,在图元装载模块将V0,V1,V2与V3这四个输出顶点装载成2个三角形的图元顶点(V0,V1,V2)与(V1,V3,V2)的过程中,V1和V2均被复用了两次,因而在属性缓存命中测试模块中,会对V1和V2分别进行重复的两次属性缓存命中。因此,现有的图元装载机制在图元顶点流中复用顶点较多时,会导致属性缓存命中测试的重复无效次数相应增多,降低了GPU的工作效率;同时,由于属性缓存命中测试模块需要使用图元装载模块输出的图元顶点流才能进行属性缓存命中测试,当顶点数据的处理逻辑较复杂时,图元装载模可能会因为待装载的输入顶点未写入至顶点数据缓冲区而进行长时间的查询等待,此时,图元装载器中的属性缓存命中测试模块也会长时间进入空载状态。

技术实现思路

[0005]本专利技术提供了一种图元数据的装载控制方法、图形处理器、设备及存储介质,以提供一种新的图元装载器工作模式,显著提高GPU的工作效率。
[0006]第一方面,本专利技术提供了一种图元数据的装载控制方法,该方法由图形处理器中的图元装载器执行,包括:从所述图形处理器中的线程构造器处获取输出顶点流;对所述输出顶点流中的各顶点进行属性缓存命中测试,并根据测试结果,形成携带命中描述信息的扩展顶点流;将所述扩展顶点流装载得到扩展图元顶点流,并将所述扩展图元顶点流发送至所述图形处理器中的顶点数据收集器。
[0007]第二方面,本专利技术提供了一种图形处理器,所述图形处理器包括至少一个图元装载器,所述图元装载器包括:输出顶点流获取模块,用于从所述图形处理器中的线程构造器处获取输出顶点
流;扩展顶点流形成模块,用于对所述输出顶点流中的各顶点进行属性缓存命中测试,并根据测试结果,形成携带命中描述信息的扩展顶点流;扩展图元顶点流装载模块,用于将所述扩展顶点流装载得到扩展图元顶点流,并将所述扩展图元顶点流发送至所述图形处理器中的顶点数据收集器。
[0008]第三方面,本专利技术提供了一种电子设备,所述电子设备包括:至少一个图形处理器;以及与所述至少一个图形处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个图形处理器执行的计算机程序,所述计算机程序被所述至少一个图形处理器执行,以使所述至少一个图形处理器能够执行本专利技术任一项所述的图元数据的装载控制方法。
[0009]第四方面,本专利技术提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一项所述的图元数据的装载控制方法。
[0010]本专利技术的技术方案,图形处理器中的图元装载器在从线程构造器获取输出顶点流后,首先对输出顶点流中的各顶点进行属性缓存命中测试,并根据测试结果形成扩展顶点流,之后将扩展顶点流装载得扩展图元顶点流,最终将扩展图元顶点流发送到图形处理器中的顶点数据收集器中进行后续处理,本专利技术的技术方案通过将属性缓存命中测试过程进行前置,属性缓存命中测试可以直接对输入顶点流中的各顶点进行属性缓存命中测试,这就避免了图元顶点流重复引用输入顶点流中的一个或者多个顶点时,所引入的重复性的属性缓存命中测试,在大大减少属性缓存命中测试的重复无效次数的同时,最大程度的避免了图元装载器中的属性缓存命中测试模块出现空载的情况,提高了GPU的工作效率。
[0011]应当理解,本部分所描述的内容并非旨在标识本专利技术的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0012]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0013]图1是现有技术所实现的一种图元数据的装载控制方法的交互图;图2是现有技术所实现的一种图元顶点装载结果的结构示意图;图3是根据本专利技术实施例一提供的一种图元数据的装载控制方法的流程图;图4是根据本专利技术实施例二提供的一种图元数据的装载控制方法的流程图;图5是根据本专利技术实施例二提供的方法所实现的一种图元数据的装载控制方法的交互图;图6是根据本专利技术实施例三提供的一种图形处理器的结构示意图;图7是实现本专利技术实施例的图元数据的装载控制方法的电子设备的结构示意图。
具体实施方式
[0014]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0015]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0016]为了使本
的人员更好地理解本专利技术方案,首先将现有技术中顶点数据的完整处理过程进行简单介绍。具体的,如图1所示:在现有技术中,线程构造器在组建得到多个用于计算顶点数据的线程后,通知调度执行器执行各线程,调度执行器在完成各线程的执行后,在通知线程构造器各线程执行完毕的同时,将各线程计算得到的顶点数据存储至顶点缓冲区中匹配的存储地址中。
[0017]线程构造器在组建各线程时,同时将与各线程匹配的输出顶本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图元数据的装载控制方法,由图形处理器中的图元装载器执行,其特征在于,包括:从所述图形处理器中的线程构造器处获取输出顶点流;对所述输出顶点流中的各顶点进行属性缓存命中测试,并根据测试结果,形成携带命中描述信息的扩展顶点流;将所述扩展顶点流装载得到扩展图元顶点流,并将所述扩展图元顶点流发送至所述图形处理器中的顶点数据收集器。2.根据权利要求1所述的方法,其特征在于,对所述输出顶点流中的各顶点进行属性缓存命中测试,包括:将所述输出顶点流中的各顶点的顶点标识,分别与预先保存的缓冲顶点标识集合进行匹配,得到与各所述顶点分别对应的命中描述信息;其中,所述缓冲顶点标识集合与所述图形处理器中的几何图元生成器中的图元顶点属性缓冲区内的缓存内容相匹配。3.根据权利要求2所述的方法,其特征在于,将所述输出顶点流中的各顶点的顶点标识,分别与预先保存的缓冲顶点标识集合进行匹配,得到与各所述顶点分别对应的命中描述信息,包括:如果当前匹配的第一顶点的顶点标识属于所述缓冲顶点标识集合,则针对所述第一顶点,生成命中缓存的命中描述信息;如果当前匹配的第二顶点的顶点标识不属于所述缓冲顶点标识集合,则针对所述第二顶点,生成未命中缓存的命中描述信息。4.根据权利要求2或3所述的方法,其特征在于,根据测试结果,形成携带命中描述信息的扩展顶点流,包括:将与每个顶点分别对应的命中描述信息,分别组装至输出顶点流的每个顶点中,得到所述扩展顶点流。5.根据权利要求1所述的方法,其特征在于,将所述扩展顶点流装载得到扩展图元顶点流,包括:按照预设的图元数据装载规则,从所述扩展顶点流中获取待图元装载顶点,并检测所述待图元装载顶点是否满足图元数据装载条件;若是,则对所述待图元装载顶点进行图元数据装载,并返回执行按照预设的图元装载规则,从所述扩展顶点流中获取待图元装载顶点的操作,直至成功装载得到与所述图元数据装载规则匹配的扩展图元顶点...

【专利技术属性】
技术研发人员:张祖英朱康挺蔡贵贤阙恒
申请(专利权)人:砺算科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1