当前位置: 首页 > 专利查询>辉达公司专利>正文

用于检索数据的应用程序编程接口制造技术

技术编号:38815763 阅读:22 留言:0更新日期:2023-09-15 19:54
用于促进数据检索的装置、系统和技术。在至少一个实施例中,使用应用程序编程接口来促进数据位置的指示以及使得从该位置检索数据。进数据位置的指示以及使得从该位置检索数据。进数据位置的指示以及使得从该位置检索数据。

【技术实现步骤摘要】
【国外来华专利技术】用于检索数据的应用程序编程接口
[0001]相关申请的交叉引用
[0002]本申请要求于2021年9月17日提交的名称为“用于检索数据的应用程序编程接口(APPLICATION PROGRAMMING INTERFACE TO RETRIEVE DATA)”的申请号为202111042206的印度专利申请以及于2021年11月9日提交的名称为“用于检索数据的应用程序编程接口(APPLICATION PROGRAMMING INTERFACE TO RETRIEVE DATA)”的序列号为17/522,605的美国专利申请的优先权,其全部公开内容通过引用并入本文中。


[0003]至少一个实施例涉及将稀疏数组和/或经mip映射的(mip

mapped)数组动态地加载到图形处理单元(GPU)中。例如,至少一个实施例涉及用于执行一个或更多个CUDA程序的处理资源,所述一个或更多个CUDA程序将稀疏数组动态地加载到GPU中,以便GPU能够将该稀疏数组数据用于图形处理任务。在另一示例中,至少一个实施例涉及用于执行一个或更多个CUDA程序的处理资源,所述一个或更多个CUDA程序将经mip映射的数组动态地加载到GPU中,以便GPU能够将所述经mip映射的数组数据用于图形处理任务。

技术介绍

[0004]在GPU中使用动态加载的数组能够极大地改进功能,因为GPU能够分配超过可用物理存储器大小的存储器,将分配的存储器与虚拟存储器表相关联,然后根据需要将存储器动态加载到物理存储器中。例如,当高分辨率纹理具有多个细节级别时,这些细节级别会消耗大量存储器。动态加载正确的细节级别能够节省GPU的有限的物理存储器,同时正确显示纹理的正确mip映射级别。
附图说明
[0005]图1示出了根据至少一个实施例的示例计算机系统,其中稀疏数组数据被加载到GPU中;
[0006]图2示出了根据至少一个实施例的用于生成动态可加载的稀疏数组数据的示例过程;
[0007]图3示出了根据至少一个实施例的动态可加载的经mip映射的数组数据的示例;
[0008]图4示出了根据至少一个实施例的示例计算机系统,其中动态加载第一细节级别的经mip映射的数组;
[0009]图5示出了根据至少一个实施例的示例计算机系统,其中动态卸载第一细节级别的经mip映射的数组并且动态加载第二细节级别的经mip映射的数组;
[0010]图6示出了根据至少一个实施例的示例性计算机系统,其中动态加载第三细节级别的经mip映射的数组;
[0011]图7示出了根据至少一个实施例的用于将稀疏数组数据动态映射到虚拟存储器的示例过程;
[0012]图8示出了根据至少一个实施例的示例计算机系统,其中处理用于创建动态可加载的稀疏数组的应用程序编程接口调用;
[0013]图9示出了根据至少一个实施例的用于访问动态可加载的稀疏数组数据的示例过程;
[0014]图10示出了根据至少一个实施例的示例性数据中心;
[0015]图11示出了根据至少一个实施例的处理系统;
[0016]图12示出了根据至少一个实施例的计算机系统;
[0017]图13示出了根据至少一个实施例的系统;
[0018]图14示出了根据至少一个实施例的示例性集成电路;
[0019]图15示出了根据至少一个实施例的计算系统;
[0020]图16示出了根据至少一个实施例的APU;
[0021]图17示出了根据至少一个实施例的CPU;
[0022]图18示出了根据至少一个实施例的示例性加速器集成切片;
[0023]图19A和图19B示出了根据至少一个实施例的示例性图形处理器;
[0024]图20A示出了根据至少一个实施例的图形核心;
[0025]图20B示出了根据至少一个实施例的GPGPU;
[0026]图21A示出了根据至少一个实施例的并行处理器;
[0027]图21B示出了根据至少一个实施例的处理集群;
[0028]图21C示出了根据至少一个实施例的图形多处理器;
[0029]图22示出了根据至少一个实施例的图形处理器;
[0030]图23示出了根据至少一个实施例的处理器;
[0031]图24示出了根据至少一个实施例的处理器;
[0032]图25示出了根据至少一个实施例的图形处理器核心;
[0033]图26示出了根据至少一个实施例的PPU;
[0034]图27示出了根据至少一个实施例的GPC;
[0035]图28示出了根据至少一个实施例的流式多处理器;
[0036]图29示出了根据至少一个实施例的编程平台的软件栈;
[0037]图30示出了根据至少一个实施例的图29的软件栈的CUDA实现;
[0038]图31示出了根据至少一个实施例的图29的软件栈的ROCm实现;
[0039]图32示出了根据至少一个实施例的图29的软件栈的OpenCL实现;
[0040]图33示出了根据至少一个实施例的由编程平台支持的软件;
[0041]图34示出了根据至少一个实施例的在图29

32的编程平台上执行的编译代码;
[0042]图35示出了根据至少一个实施例的在图29

32的编程平台上执行的更详细的编译代码;
[0043]图36示出了根据至少一个实施例的在编译源代码之前转换源代码;
[0044]图37A示出了根据至少一个实施例的被配置为使用不同类型的处理单元来编译和执行CUDA源代码的系统;
[0045]图37B示出了根据至少一个实施例的被配置为使用CPU和启用CUDA的GPU来编译和执行图37A的CUDA源代码的系统;
[0046]图37C示出了根据至少一个实施例的被配置为使用CPU和未启用CUDA的GPU来编译和执行图37A的CUDA源代码的系统;
[0047]图38示出了根据至少一个实施例的由图37C的CUDA到HIP转换工具转换的示例性内核;
[0048]图39更详细地示出了根据至少一个实施例的图37C的未启用CUDA的GPU;
[0049]图40示出了根据至少一个实施例的示例性CUDA网格的线程如何被映射到图39的不同计算单元;以及
[0050]图41示出了根据至少一个实施例的如何将现有CUDA代码迁移到数据并行C++代码。
具体实施方式
[0051]图1示出了根据至少一个实施例的示例计算机系统100,其中稀疏数组数据被加载到GPU中。在至少一个实施例中,处理器102可以连接到图形处理器108的后备存储器104。在至少一个实施例中,处理器102是单核处理器。在至少一个实施例中,处理器102是多核处理器。在至少一个实施例中,一个或更多个附加处理器(未示出)连接到后备存储器104。在至少一个实施例中,处理器102是处理系统的元件,诸如本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种处理器,其包括:一个或更多个电路,所述一个或更多个电路用于使得至少部分地基于应用程序编程接口(“API”)来指示数据的位置以及从所述位置检索所述数据。2.根据权利要求1所述的处理器,其中,所述API指示所述数据的驻留。3.根据权利要求1所述的处理器,其中,所述位置由数组引用指示。4.根据权利要求1所述的处理器,其中:所述位置由数组引用来指示,所述数组引用存储在图形处理单元(“GPU”)中;以及所述数组引用指示连接到所述GPU的存储器中的存储器位置。5.根据权利要求1所述的处理器,其中:所述位置由数组引用来指示,所述数组引用存储在并行处理单元(“PPU”)的存储器中;以及所述数组引用指示连接到所述PPU的存储器中的存储器位置。6.根据权利要求1所述的处理器,其中,所述API使得执行第二API,所述第二API使得至少部分地基于所述数据的所述位置将所述数据映射到与GPU连接的存储器。7.根据权利要求1所述的处理器,其中,所述数据为稀疏数组数据。8.根据权利要求1所述的处理器,其中,所述数据是经mip映射的数组数据。9.根据权利要求1所述的处理器,其中,所述数据是纹理数据。10.一种方法,其包括:使用应用程序编程接口(“API”)来指示数据的位置;以及至少部分地基于所述API从所述位置检索所述数据。11.根据权利要求10所述的方法,其中,所述位置由数组引用指示。12.根据权利要求10所述的方法,进一步包括:使用第二API,至少部分地基于所述位置将所述数据映射到与图形处理单元(“GPU”)连接的存储器。13.根据权利要求10所述的方法,进一步包括:使用第二API,至少部分地基于所述位置将所述数据从与GPU连接的存储器解映射。14.根据权利要求10所述的方法,其中,所述API指示所述数据被映射到与图形处理单元(“GPU”)连接的存储器。15.根据权利要求10所述的方法,其中,所述API指示所述数据未被映射到与图形处理单元(“GPU”)连接的存储器。16.根据权利要求10所述的方法,进一步包括:使用第二API,至少部分地基于所述位置来确定所述数据是否被映射到与GPU连接的存储器。17.根据权利要求10所述的方法,其中,所述位置由对连接到GPU的存储器的引用来指示,并且其中,所述引用存储在所述GPU中。18.根据权利要求10所述的方法,其中,所述位置由对连接到并行处理单元(“PPU”)的存储器的引用来指示,并且其中,所述引用存储在所述PPU中。19.一种计算机系统,其包括存储器和一个或更多个处理器,所述存储器存储可执行指令,所述可执行指令作为由所述一个或更多个处理器执行的结果,使得所述计算机系统:
使得至少部分地基于应用程序编程接口(“API”)来指示数据的位置以及从所述位置检索所述数据。20.根据权利要求19所述的计算机系统,其中,所述API指示所述数据的驻留。21.根据权利要求19所述的计算机系统,其中,所述位置由数组引...

【专利技术属性】
技术研发人员:A
申请(专利权)人:辉达公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1