本发明专利技术实施例公开了一种GPU渲染核数据的预读取方法、装置及计算机存储介质,该方法可以包括:通过调度器根据待渲染数据调度GPU中的渲染核执行渲染;在所述调度器调度所述渲染核执行渲染的同时,通过数据预取模块将待渲染数据从显存中预先读取至二级缓存;通过所述渲染核根据所述二级缓存中已预取的待渲染数据执行渲染。
A pre reading method, device and computer storage medium of GPU rendering core data
【技术实现步骤摘要】
一种GPU渲染核数据的预读取方法、装置及计算机存储介质
本专利技术实施例涉及图形处理器(GPU,GraphicsProcessingUnit)
,尤其涉及一种GPU渲染核数据的预读取方法、装置及计算机存储介质。
技术介绍
GPU的渲染核在进行渲染时,需要从显存中读取数据以进行渲染,通常借助于高速缓存从显存中进行数据读取,并传输至渲染核处理。但是,在渲染核首次运行进行渲染的情况下,通常首先需要渲染核向高速缓存发送数据请求,高速缓存根据数据请求从显存中获取到待渲染的数据后反馈至渲染核以进行渲染。由此造成渲染核在上述情况下,会花费较长的时间才能够读取到待渲染的数据,从而降低了渲染核的工作效率。
技术实现思路
有鉴于此,本专利技术实施例期望提供一种GPU渲染核数据的预读取方法、装置及计算机存储介质;能够提高渲染核首次运行情况下的渲染数据读取速度,提高渲染核的工作效率。本专利技术实施例的技术方案是这样实现的:第一方面,本专利技术实施例提供了一种GPU渲染核数据的预读取方法,所述方法包括:通过调度器根据待渲染数据调度GPU中的渲染核执行渲染;在所述调度器调度所述渲染核执行渲染的同时,通过数据预取模块将待渲染数据从显存中预先读取至二级缓存;通过所述渲染核根据所述二级缓存中已预取的待渲染数据执行渲染。第二方面,本专利技术实施例提供了一种GPU,所述GPU包括:调度器、数据预取模块、渲染核以及二级缓存;其中,所述调度器,经配置以执行:根据待渲染数据调度GPU中的渲染核执行渲染;所述数据预取模块,经配置以执行:在所述调度器调度所述渲染核执行渲染的同时,将待渲染数据从显存中预先读取至所述二级缓存;所述渲染核,经配置以执行:根据所述二级缓存中已预取的待渲染数据执行渲染。第三方面,本专利技术实施例提供了一种计算机存储介质,所述计算机存储介质存储有GPU渲染核数据的预读取程序,所述GPU渲染核数据的预读取程序被至少一个处理器执行时实现第一方面所述的GPU渲染核数据的预读取方法的步骤。本专利技术实施例提供了一种GPU渲染核数据的预读取方法、装置及计算机存储介质;调度器在进行渲染核调度的同时,数据预取模块将待渲染数据从显存中预先读取至二级缓存,如此,当渲染核需要读取待渲染数据以执行渲染的时候,能够根据二级缓存中已预取的待渲染数据进行渲染,从而无需等待L2-Cache由显存中读取数据,提高渲染核首次运行情况下的渲染数据读取速度,提高渲染核的工作效率。附图说明图1为本专利技术实施例提供的一种计算装置的组成示意图;图2为本专利技术实施例提供的处理器、GPU和系统内存的实例框图;图3为本专利技术实施例提供的一种GPU的内部结构示意图;图4为本专利技术实施例提供的一种数据读取流程示意图;图5为本专利技术实施例提供的另一种GPU的内部结构示意图;图6为本专利技术实施例提供的一种GPU渲染核数据的预读取方法流程示意图;图7为本专利技术实施例提供的一种GPU的组成示意图;图8为本专利技术实施例提供的另一种GPU的组成示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。参见图1,其示出了能够实现本专利技术实施例技术方案的计算装置2,该计算装置2的实例包括但不限于:无线装置、移动或蜂窝电话(包含所谓的智能电话)、个人数字助理(PDA)、视频游戏控制台(包含视频显示器、移动视频游戏装置、移动视频会议单元)、膝上型计算机、桌上型计算机、电视机顶盒、平板计算装置、电子书阅读器、固定或移动媒体播放器,等。在图1的实例中,该计算装置2可以包括:处理器6、系统内存10和GPU12。计算装置2还可包含显示处理器14、收发器模块3、用户接口4和显示器8。收发器模块3和显示处理器14两者可为与处理器6和/或GPU12相同的集成电路(IC)的部分,两者可在包含处理器6和/或GPU12的一或多个IC的外部,或可形成于在包含处理器6和/或GPU12的IC外部的IC中。为清楚起见,计算装置2可包含图1中未图示的额外模块或单元。举例来说,计算装置2可在其中计算装置2为移动无线电话或的实例中包含扬声器和麦克风(两者均未在图1中示出)来实现电话通信,或在计算装置2为媒体播放器的情况下包含扬声器。计算装置2还可包含摄像机。此外,计算装置2中所示的各种模块和单元可能不是在计算装置2的每个实例中都是必需的。举例来说,在计算装置2为桌上型计算机或经装备以与外部用户接口或显示器连接的其它装置的实例中,用户接口4和显示器8可在计算装置2外部。用户接口4的实例包含(但不限于)轨迹球、鼠标、键盘和其它类型的输入装置。用户接口4还可为触摸屏,并且可作为显示器8的部分并入。收发器模块3可包含电路以允许计算装置2与另一装置或网络之间的无线或有线通信。收发器模块3可包含调制器、解调器、放大器和用于有线或无线通信的其它此类电路。处理器6可为微处理器,例如中央处理单元(CPU),其经配置以处理供执行的计算机程序的指令。处理器6可包括控制计算装置2的运算的通用或专用处理器。用户可将输入提供到计算装置2,以致使处理器6执行一或多个软件应用程序。在处理器6上执行的软件应用程序可包含(例如)操作系统、文字处理器应用程序、电子邮件应用程序、电子表格应用程序、媒体播放器应用程序、视频游戏应用程序、图形用户接口应用程序或另一程序。另外,处理器6可执行用于控制GPU12的运算的GPU驱动程序22。用户可经由一或多个输入装置(未图示)(例如,键盘、鼠标、麦克风、触摸垫或经由用户输入接口4耦合到计算装置2的另一输入装置)将输入提供到计算装置2。在处理器6上执行的软件应用程序可包含一或多个图形渲染指令,其指令处理器6来致使将图形数据渲染到显示器8。在一些实例中,所述软件指令可符合图形应用程序编程接口(API),例如开放式图形库OpenGLAPI、开放式图形库嵌入系统(OpenGLES)API、Direct3DAPI、X3DAPI、RenderManAPI、WebGLAPI、开放式计算语言(OpenCLTM)、RenderScript或任何其它异构计算API,或任何其它公用或专有标准图形或计算API。所述软件指令还可为针对无渲染算法(例如计算摄影、卷积神经网络、视频处理、科学应用程序等)的指令。为了处理图形渲染指令,处理器6可向GPU12发出一或多个图形渲染命令(例如,通过GPU驱动程序22),以致使GPU12执行图形数据的渲染中的一些或全部。在一些实例中,待渲染的图形数据可包含例如点、线、三角形、四边形、三角形带等图形图元的列表。GPU12可经配置以执行图形运算,从而将一或多个图形图元渲染到显示器8。因此,当在处理器6上执行的软件应用中的一者需要图形处理时,处理器6可将图形命令和图形数据提供到GPU12以用于渲染到显示器8。图形数据可包含(例如)绘制命令、状态信息、图元信息、纹理信息等。在一些情况下,GPU12可内置有高度并行结构,其本文档来自技高网...
【技术保护点】
1.一种GPU渲染核数据的预读取方法,其特征在于,所述方法包括:/n通过调度器根据待渲染数据调度GPU中的渲染核执行渲染;/n在所述调度器调度所述渲染核执行渲染的同时,通过数据预取模块将待渲染数据从显存中预先读取至二级缓存;/n通过所述渲染核根据所述二级缓存中已预取的待渲染数据执行渲染。/n
【技术特征摘要】
1.一种GPU渲染核数据的预读取方法,其特征在于,所述方法包括:
通过调度器根据待渲染数据调度GPU中的渲染核执行渲染;
在所述调度器调度所述渲染核执行渲染的同时,通过数据预取模块将待渲染数据从显存中预先读取至二级缓存;
通过所述渲染核根据所述二级缓存中已预取的待渲染数据执行渲染。
2.根据权利要求1所述的方法,其特征在于,所述通过数据预取模块将待渲染数据从显存中预先读取至二级缓存之前,所述方法还包括:
通过所述调度器向所述数据预取模块发送数据预取请求;其中,所述数据预取请求用于指示所述数据预取模块从所述显存中预先读取所述待渲染数据;
相应地,所述通过数据预取模块将待渲染数据从显存中预先读取至二级缓存,包括:
通过所述数据预取模块根据所述数据预取请求将所述待渲染数据从所述显存中读取至所述二级缓存。
3.根据权利要求2所述的方法,其特征在于,相应于所述待渲染数据的数据量超过所述GPU中所有渲染核的最大处理数据量,则所述数据预取请求用于指示所述数据预取模块按照所述渲染核的最大处理数据量从所述显存中预先读取待渲染数据至二级缓存;
相应于所述待渲染数据的数据量未超过所述GPU中所有渲染核的最大处理数据量,则所述数据预取请求用于指示所述数据预取模块将全部所述待渲染数据从所述显存中预先读取至二级缓存。
4.根据权利要求1所述的方法,其特征在于,在通过所述渲染核根据所述二级缓存中已预取的待渲染数据执行渲染之前,所述方法还包括:
通过所述渲染核向一级缓存读取所述待渲染数据;
相应于所述一级缓存未存储所述待渲染数据,所述一级缓存向所述二级缓存发送数据读取请求;
所述二级缓存根据所述数据读取请求向所述一级缓存传输已预取的待渲染数据;
所述渲染核读取所述一级缓存接收到的由所述二级缓存已预取的待渲染数据。
5.根据权利要求1所述的方法,其特征在于,所述二级缓存的容量大于或等于渲染程序的数据量与所述GPU中所有渲染核的最大处理数据量之和。
6.一种GPU,其特征在于,所述G...
【专利技术属性】
技术研发人员:樊良辉,张竞丹,李洋,
申请(专利权)人:南京芯瞳半导体技术有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。