当前位置: 首页 > 专利查询>辉达公司专利>正文

用于取消关联虚拟地址的应用程序编程接口制造技术

技术编号:39716097 阅读:6 留言:0更新日期:2023-12-17 23:24
公开了用于管理存储器阵列的装置

【技术实现步骤摘要】
【国外来华专利技术】用于取消关联虚拟地址的应用程序编程接口
[0001]相关申请的交叉引用
[0002]要求优先权
[0003]本申请要求获得
2022
年1月
10
日提交的题为“用于取消关联虚拟地址的应用程序编程接口
(APPLICATION PROGRAMMING INTERFACE TO DISASSOCIATE A VIRTUAL ADDRESS)”的美国专利申请
17/572,409
的权益,该申请的全部内容出于所有目的在此并入本文



[0004]至少一个实施例涉及用于执行一个或更多个
CUDA
程序的处理资源

在至少一个实施例中,使用一个或更多个
CUDA
程序将阵列数据动态地加载到
GPU
并且从
GPU
中卸载阵列数据


技术介绍

[0005]执行计算操作会使用大量的内存

时间或计算资源

通过使用一个或更多个
CUDA
程序动态加载和卸载阵列数据到
GPU
,可以改善用于执行计算操作的内存

时间或计算资源的量

附图说明
[0006]图1示出了根据至少一个实施例的其中动态加载阵列数据的示例计算机系统;
[0007]图2示出了根据至少一个实施例的其中动态加载和卸载阵列数据的示例计算机系统;
[0008]图3示出了根据至少一个实施例的其中动态加载和卸载阵列数据的示例过程;
[0009]图4示出了根据至少一个实施例的其中动态加载阵列数据的示例计算机系统;
[0010]图5示出了根据至少一个实施例的其中动态加载和卸载阵列数据的示例计算机系统;
[0011]图6示出了根据至少一个实施例的其中动态地卸载和重新加载阵列数据的示例计算机系统;
[0012]图7示出了根据至少一个实施例的其中动态地卸载和重新加载阵列数据的示例计算机系统;
[0013]图8示出了根据至少一个实施例的其中尝试对阵列数据进行多重映射的示例计算机系统;
[0014]图9示出了根据至少一个实施例的其中用于将阵列数据动态映射到虚拟存储器的示例过程;
[0015]图
10
示出了根据至少一个实施例的动态可加载稀疏阵列数据的示例;
[0016]图
11
示出了根据至少一个实施例的其中动态加载
mip
映射阵列的第一级细节的示例计算机系统;
[0017]图
12
示出了根据至少一个实施例的其中动态地卸载
mip
映射阵列的第一级细节,并且动态地加载
mip
映射阵列的第二级细节的示例计算机系统;
[0018]图
13
示出了根据至少一个实施例的其中处理用于创建动态可加载阵列的应用处理接口调用的示例软件堆栈;
[0019]图
14
示出了根据至少一个实施例的示例性数据中心;
[0020]图
15
示出了根据至少一个实施例的处理系统;
[0021]图
16
示出了根据至少一个实施例的计算机系统;
[0022]图
17
示出了根据至少一个实施例的系统;
[0023]图
18
示出了根据至少一个实施例的示例性集成电路;
[0024]图
19
示出了根据至少一个实施例的计算系统;
[0025]图
20
示出了根据至少一个实施例的
APU

[0026]图
21
示出了根据至少一个实施例的
CPU

[0027]图
22
示出了根据至少一个实施例的示例性加速器集成切片;
[0028]图
23A
和图
23B
示出了根据至少一个实施例的示例性图形处理器;
[0029]图
24A
示出了根据至少一个实施例的图形核心;
[0030]图
24B
示出了根据至少一个实施例的
GPGPU

[0031]图
25A
示出了根据至少一个实施例的并行处理器;
[0032]图
25B
示出了根据至少一个实施例的处理集群;
[0033]图
25C
示出了根据至少一个实施例的图形多处理器;
[0034]图
26
示出了根据至少一个实施例的图形处理器;
[0035]图
27
示出了根据至少一个实施例的处理器;
[0036]图
28
示出了根据至少一个实施例的处理器;
[0037]图
29
示出了根据至少一个实施例的图形处理器核心;
[0038]图
30
示出了根据至少一个实施例的
PPU

[0039]图
31
示出了根据至少一个实施例的
GPC

[0040]图
32
示出了根据至少一个实施例的流式多处理器;
[0041]图
33
示出了根据至少一个实施例的编程平台的软件栈;
[0042]图
34
示出了根据至少一个实施例的图
33
的软件栈的
CUDA
实现;
[0043]图
35
示出了根据至少一个实施例的图
33
的软件栈的
ROCm
实现;
[0044]图
36
示出了根据至少一个实施例的图
33
的软件栈的
OpenCL
实现;
[0045]图
37
示出了根据至少一个实施例的由编程平台支持的软件;
[0046]图
38
示出了根据至少一个实施例的在图
33

36
的编程平台上执行的编译代码;
[0047]图
39
示出了根据至少一个实施例的在图
33

36
的编程平台上执行的更详细的编译代码;
[0048]图
40
示出了根据至少一个实施例的在编译源代码之前转换源代码;
[0049]图
41A
示出了根据至少一个实施例的被配置成使用不同类型的处理单元来编译和执行
CUDA
源代码的系统;
[0050]图
41B
示出了根据至少一个实施例的被配置成使用
CPU
和启用...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.
一种处理器,包括:一个或更多个电路,所述一个或更多个电路用于使得执行应用程序编程接口
(API)
,以将由所述
API
指示的虚拟地址与对应物理地址取消关联
。2.
根据权利要求1所述的处理器,其中由所述
API
指示的所述虚拟地址是非稀疏阵列的虚拟地址
。3.
根据权利要求1所述的处理器,其中所述对应物理地址是非稀疏阵列的后备存储器的物理地址
。4.
根据权利要求1所述的处理器,其中所述
API
指示存储在所述对应物理地址处的数据的驻留
。5.
根据权利要求1所述的处理器,其中所述虚拟地址被存储在图形处理单元的存储器中
。6.
根据权利要求1所述的处理器,其中所述虚拟地址存储在页表中
。7.
根据权利要求1所述的处理器,其中所述对应物理地址是图形处理单元的存储器中的数据位置的地址
。8.
根据权利要求1所述的处理器,其中所述一个或更多个电路用于使得执行第二
API
,以将所述虚拟地址与第二对应物理地址相关联
。9.
根据权利要求1所述的处理器,其中所述对应物理地址是纹理数据的物理地址
。10.
根据权利要求1所述的处理器,其中所述
API
指示所述虚拟地址是否与所述对应物理地址相关联
。11.
一种计算机实现的方法,包括:使得执行应用程序编程接口
(API)
,以将由所述
API
指示的所述虚拟地址与对应物理地址取消关联
。12.
根据权利要求
11
所述的计算机实现的方法,其中由所述
API
指示的所述虚拟地址是非稀疏阵列的虚拟地址
。13.
根据权利要求
11
所述的计算机实现的方法,其中所述对应物理地址是非稀疏阵列的后备存储器的物理地址
。14.
根据权利要求
11
所述的计算机实现的方法,其中所述
API
指示存储在所述对应物理地址处的数据的驻留
。15.
根据权利要求
11
所述的计算机实现的方法,其中所述虚拟地址被存储在图形处理单元的存储器中
。16.
根据权利要求
11
所述的计算机实现的方法,其中所述虚拟地址被存储在并行处理单元的存储器中
。17.
根据权利要求
11
所述的计算机实现的方法,其中所述虚拟地址被存储在通用图形处理单元的存储器中
。18.
根据权利要求
11
所述的计算机实现的方法,其中所述对应物理地址是图形处理单元的存储器中的数据位置的地址
。19.
根据权利要求
11
所述的计算机实现的方法,其中所述对应物理地址是主机存储器中的数据位置的地址
。20.
根据权利要求
11
所述的计算机实现的方法,进一步包括:
作为从与所述对应物理地址取消关联的所述虚拟地址读取的结果,检索包含一个或更多个标记值的阵列
。21.
一种计算机系统,包括:一个或更多个处理器和存储可执行指令的存储器,作为所述可执行指令由所述一个或更多个处理器执行的结果,使所述一个或更多个处理器使得执行应用程序编程接口
(API)
,以将由所述
API
指示的虚拟地址与对应物理地址取消关联
。22.
根据权利要求
21
所述的计算机系统,其中由所述
API
指示的所述虚拟地址是非稀疏阵列的虚拟地址
。23.
根据权利要求
21
所述的计算机系统,其中所述对应物理地址是非稀疏阵列...

【专利技术属性】
技术研发人员:A
申请(专利权)人:辉达公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1