【技术实现步骤摘要】
多GPU帧渲染
本专利技术涉及图像渲染,并且更具体地,涉及采用多个图形处理单元的帧渲染。
技术介绍
图形渲染系统中的两个关键性能度量是帧速率和延迟。在许多应用(诸如增强现实)中,降低延迟对于真实般的用户体验非常重要。交替帧渲染(AFR)可以通过将交替帧指派给对应的交替图形处理单元(GPU)来提高帧速率。但是,AFR通常不会改善延迟,并且可能会导致在具有帧间数据依赖性的应用中性能下降。分帧渲染(SFR)是另一种可以提高某些应用的帧速率的技术。但是,SFR对于现代工作负载来说是不切实际的。此外,AFR和SFR都会施加某些计算和运行时间限制,其限制对许多当前图形应用的适用性。因此,具有解决与现有技术相关的这些问题和/或其他问题的需求。
技术实现思路
公开了一种用于使用多个图形处理单元(GPU)渲染图形帧的方法、计算机可读介质和系统。该方法包括由耦合到第一存储器电路的第一图形处理单元(GPU)生成与渲染第一帧的第一图元相关联的一个或更多个第一存储器访问请求,其中第一存储器访问请求中的至少一个以第一数据页为目标,所述第一数据页物理地驻留在耦合到第二GPU的第二存储器电路内。该方 ...
【技术保护点】
1.一种方法,包括:由耦合到第一存储器电路的第一图形处理单元(GPU)生成与渲染第一帧的第一图元相关联的一个或更多个第一存储器访问请求,其中所述第一存储器访问请求中的至少一个以第一数据页为目标,所述第一数据页物理地驻留在耦合到第二GPU的第二存储器电路内;由所述第一GPU通过将所述第一GPU耦合到所述第二GPU的第一数据链路来请求所述第一数据页;由所述第一GPU内的寄存器电路累加对所述第一数据页的访问请求计数;以及由所述第一GPU通知驱动程序所述访问请求计数已达到指定阈值。
【技术特征摘要】
2017.12.28 US 15/857,3301.一种方法,包括:由耦合到第一存储器电路的第一图形处理单元(GPU)生成与渲染第一帧的第一图元相关联的一个或更多个第一存储器访问请求,其中所述第一存储器访问请求中的至少一个以第一数据页为目标,所述第一数据页物理地驻留在耦合到第二GPU的第二存储器电路内;由所述第一GPU通过将所述第一GPU耦合到所述第二GPU的第一数据链路来请求所述第一数据页;由所述第一GPU内的寄存器电路累加对所述第一数据页的访问请求计数;以及由所述第一GPU通知驱动程序所述访问请求计数已达到指定阈值。2.如权利要求1所述的方法,还包括:由所述第一GPU接收第一复制命令,以通过所述第一数据链路从所述第二存储器电路复制所述第一数据页,以在所述第一GPU访问与渲染第二帧的所述第一图元相关联的所述第一数据页之前在所述第一存储器电路内产生所述第一数据页的副本。3.如权利要求2所述的方法,还包括:由所述第一GPU执行所述第一复制命令;以及由所述第一GPU生成与渲染所述第一图元相关联的一个或更多个第二存储器访问请求,其中所述第二存储器访问请求中的至少一个以所述第一存储器电路内的所述第一数据页的副本为目标。4.如权利要求2所述的方法,其中所述第一数据页以压缩格式存储在所述第二存储器电路内,并且所述第一数据页的副本以压缩格式存储在所述第一存储器电路内。5.如权利要求4所述的方法,其中通过所述第一数据链路以所述压缩格式复制所述第一数据页。6.如权利要求1所述的方法,其中第一命令流指定所述第一帧的第一渲染通道,第二命令流指定第二帧的第一渲染通道,并且通知发生在所述第一帧期间。7.如权利要求1所述的方法,还包括:在生成所述一个或更多个第一存储器访问请求之前:由所述第一GPU接收所述第一图元;以及由所述第一GPU内的裁剪电路确定所述第一图元的位置与指派给所述第一GPU的所述第一帧的第一区域相交。8.如权利要求1所述的方法,其中通过所述第一数据链路请求所述第一数据页包括确定所述第一数据页驻留在映射到所述第二GPU的第一远程孔径内。9.如权利要求8所述的方法,其中存储器管理单元确定所述第一页面驻留在所述第一远程孔径内。10.如权利要求1所述的方法,其中所述一个或更多个第一存储器访问请求包括对驻留在所述第二存储器电路内的数据执行的原子访问操作。11.如权利要求1所述的方法,还包括:在生成所述一个或更多个第一存储器访问请求之前:由所述第一GPU接收所述第一图元;以及由前置着色器指令确定包括所述第一图元的第一协作线程阵列将在所述第一GPU上执行。12.如权利要求1所述的方法,其中所...
【专利技术属性】
技术研发人员:R·L·季米特洛夫,K·A·德米特里耶夫,A·达科夫斯基,T·黄,W·A·甘地,L·V·沙,
申请(专利权)人:辉达公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。