当前位置: 首页 > 专利查询>英特尔公司专利>正文

多贴片存储器管理机制制造技术

技术编号:29838274 阅读:23 留言:0更新日期:2021-08-27 14:28
公开了用于实现多贴片存储器管理的图形处理器。在一个实施例中,图形处理器包括:具有本地存储器的第一图形装置;具有本地存储器的第二图形装置;以及图形驱动器,该图形驱动器用于提供具有公共虚拟地址范围的单个虚拟分配,以将资源镜像到第一和第二图形装置的每个本地存储器。

【技术实现步骤摘要】
多贴片存储器管理机制
实施例一般涉及数据处理,并且更特别地涉及在图形环境中提供多贴片(multi-tile)存储器管理机制。
技术介绍
当前并行图形数据处理包括被开发以对图形数据执行特定操作(诸如例如线性内插、曲面细分、光栅化(rasterization)、纹理映射、深度测试等)的系统和方法。传统上,图形处理器使用固定功能计算单元来处理图形数据;然而,最近,已使图形处理器的部分可编程,使得此类处理器能够支持用于处理顶点和片段数据的更多种多样的操作。为了进一步增加性能,图形处理器通常实现诸如流水线之类的处理技术,其试图遍及图形流水线的不同部分并行处理尽可能多的图形数据。具有单指令多线程(SIMT)架构的并行图形处理器设计成最大化图形流水线中的并行处理的量。在SIMT架构中,并行线程群组试图尽可能经常一起同步执行程序指令以增加处理效率。SIMT架构的软件和硬件的一般概述能够在ShaneCook,CUDAProgramming第3章,第37-51页(2013)中找到。附图说明为了在其中能够详细理解本实施例的上述特征的方式,可以通过参考实施例来具有对上面简要概括的实施例的更特定的描述,所述实施例中的一些实施例在附图中示出。然而,要注意的是,附图仅示出了典型的实施例,并且因此不要被认为限制其范围。图1是根据实施例的处理系统100的框图。图2A-2D示出了根据实施例的计算系统和图形处理器。图3A-3C是根据实施例的另外图形处理器和计算加速器架构的框图。图4是根据一些实施例的图形处理器的图形处理引擎410的框图。图5A-5B示出了根据实施例的包括在图形处理器核中采用的处理元件阵列的线程执行逻辑500。图6示出了根据实施例的另外执行单元600。图7是示出根据一些实施例的图形处理器指令格式700的框图。图8是根据实施例的图形处理器800的另一实施例的框图。图9A是示出根据一些实施例的图形处理器命令格式900的框图。图9B是示出根据实施例的图形处理器命令序列910的框图。图10示出了根据一些实施例的数据处理系统1000的示例性图形软件架构。图11A是示出根据实施例的可以用于制造集成电路以执行操作的IP核开发系统1100的框图。图11B示出了根据一些实施例的集成电路封装组装件1170的截面侧视图。图11C示出了包括连接到衬底1180(例如基础管芯)的硬件逻辑小芯片(chiplet)的多个单元的封装组装件1190。图11D示出了根据实施例的包括可互换小芯片1195的封装组装件1194。图12示出了示例性集成电路并且图13A-13B示出了根据本文中描述的各种实施例的可以使用一个或多个IP核来制作的关联的图形处理器。图14A和14B示出用户模式驱动器(UMD)(例如,UMD1026)通过创建虚拟地址的单独的镜像分配(mirroredallocation)并插入对应的复制命令以确保正确地复制数据来显式地镜像(mirror)资源的方法。图15A和15B示出了根据一个实施例的UMD管理的镜像分配。图16A和16B示出了根据一个实施例的对于从公共虚拟地址范围镜像物理页(physicalpage)的KMD存储器管理器支持。图17A和17B示出了根据一个实施例的交织物理页以用于跨所有参与贴片的虚拟分配。图18A和18B示出了根据一个实施例的利用节点掩码(nodemask)限制的上色分配(coloredallocation)(不同的着色)。图19A示出了根据一个实施例的将资源放置到堆(heap)1922中。图19B示出了根据一个实施例的将资源放置到图形处理器的贴片的上色(着色)分配中的堆的映射。图20A和20B示出了根据一个实施例的分区(partition)渲染目标的4个贴片。图21A-21C示出了根据实施例的另外图形多处理器。具体实施方式在一些实施例中,图形处理单元(GPU)通信地(communicatively)耦合到主机/处理器核以加速图形操作、机器学习操作、模式分析操作和各种通用GPU(GPGPU)功能。GPU可以通过总线或另一互连(例如,高速互连,诸如PCIe或NVLink)通信地耦合到主机处理器/核。在其它实施例中,GPU可以被集成在与核相同的封装或芯片上,并且通过内部处理器总线/互连(即,在封装或芯片内部)通信地耦合到核。不管在其中GPU被连接的方式如何,处理器核都可以以工作描述符中包含的命令/指令序列的形式将工作分配给GPU。GPU然后使用专用电路/逻辑以便高效地处理这些命令/指令。在以下描述中,阐明了许多特定细节以提供更透彻的理解。然而,对于本领域技术人员将显而易见的是,可以在没有这些特定细节中的一个或多个特定细节的情况下实践本文中描述的实施例。在其它实例中,众所周知的特征没有被描述,以避免使本实施例的细节模糊不清。系统概述图1是根据实施例的处理系统100的框图。系统100可以用于单处理器台式电脑系统、多处理器工作站系统或具有大量处理器102或处理器核107的服务器系统中。在一个实施例中,系统100是并入片上系统(SoC)集成电路内的处理平台,所述片上系统(SoC)集成电路供在移动、手持式或嵌入式装置中(诸如在带有到局域网或广域网的有线或无线连接性的物联网(IoT)装置内)使用。在一个实施例中,系统100能够包括以下各项、与以下各项耦合或者被集成在以下各项内:基于服务器的游戏平台;游戏控制台,包括游戏和媒体控制台;移动游戏控制台、手持式游戏控制台或在线游戏控制台。在一些实施例中,系统100是以下各项的一部分:移动电话、智能电话、平板计算装置或移动互联网连接的装置,诸如带有低内部存储容量的膝上型电脑。处理系统100还能够包括以下各项、与以下各项耦合或者被集成在以下各项内:可穿戴装置,诸如智能手表可穿戴装置;智能眼镜或服装,其用增强现实(AR)或虚拟现实(VR)特征来被增强以提供视觉、音频或触觉输出以补充现实世界视觉、音频或触觉体验或者以其它方式提供文本、音频、图形、视频、全息图像或视频、或者触觉反馈;其它增强现实(AR)装置;或者其它虚拟现实(VR)装置。在一些实施例中,处理系统100包括电视或机顶盒装置,或者是电视或机顶盒装置的一部分。在一个实施例中,系统100能够包括以下各项、与以下各项耦合或者被集成在以下各项内:自动驾驶交通工具,诸如公共汽车、牵引车拖车、汽车、摩托车或电动自行车、飞机或滑翔机(或其任何组合)。自动驾驶交通工具可以使用系统100来处理在交通工具周围感测到的环境。在一些实施例中,一个或多个处理器102各自包括一个或多个处理器核107以处理指令,所述指令在被执行时,执行用于系统或用户软件的操作。在一些实施例中,一个或多个处理器核107中的至少一个处理器核被配置成处理特定指令集109。在一些实施例中,指令集109可以促进复杂指令集计算(CISC)、精简指令集计算(本文档来自技高网...

【技术保护点】
1.一种用于多贴片架构的图形处理器,包括:/n具有本地存储器的第一图形装置;/n具有本地存储器的第二图形装置;以及/n具有单个虚拟分配的资源,所述单个虚拟分配被提供有公共虚拟地址范围,以将所述资源镜像到所述第一和第二图形装置的每个本地存储器。/n

【技术特征摘要】
20200226 US 16/8024271.一种用于多贴片架构的图形处理器,包括:
具有本地存储器的第一图形装置;
具有本地存储器的第二图形装置;以及
具有单个虚拟分配的资源,所述单个虚拟分配被提供有公共虚拟地址范围,以将所述资源镜像到所述第一和第二图形装置的每个本地存储器。


2.根据权利要求1所述的图形处理器,其中所述单个虚拟分配包括用于所述第一图形装置的第一页表和用于所述第二图形装置的第二页表,其中所述第一和第二页表提供统一的物理地址空间。


3.根据权利要求2所述的图形处理器,其中所述第一图形装置通信地耦合到所述第二图形装置,并且每个图形装置包括用于进程的所述多贴片架构的图形贴片。


4.根据权利要求2所述的图形处理器,其中用于镜像所述资源的所述单个虚拟分配包括用于所述第一和第二图形装置的每个本地存储器的物理页。


5.根据权利要求1所述的图形处理器,其中镜像的资源包括只读资源。


6.根据权利要求1所述的图形处理器,其中所述第一图形装置包括图形处理单元。


7.根据权利要求1所述的图形处理器,其中所述单个虚拟分配被提供有内核模式图形驱动器。


8.根据权利要求7所述的图形处理器,其中
用户模式图形驱动器用于向所述内核模式图形驱动器提供具有分配创建请求的私有数据,以指示所述资源是否需要被镜像,连同节点掩码,以指示哪些图形装置将正在访问所述资源。


9.一种用于多贴片架构的图形处理器,包括:
具有本地存储器的第一图形装置;
具有本地存储器的第二图形装置;以及
具有单个虚拟分配的共享资源,所述单个虚拟分配被提供有公共虚拟地址范围,以将所述共享资源的物理页交织到所述第一和第二图形装置的本地存储器。


10.根据权利要求9所述的图形处理器,其中所述单个虚拟分配将第一物理页交织到所述第一图形装置的所述本地存储器,并且将第二物理页交织到所述第二图形装置的所述本地存储器。


11.根据权利要求9所述的图形处理器,其中所述单个虚拟分配将物理页的第一子集交织到所述第一图形装置的所述本地存储器,并且将所述物理页的第二子集交织到所述第二图形装置的所述本地存储器。


12.根据权利要求9所述的图形处理器,其中所述第一图形装置通信地耦合到所述第二图形装置。


13.根据权利要求9所述的图形处理器,其中所述共享资源包括共享读取/写入缓冲器。


14.根据权利要求9所述的图形处理器,进一步包括:
具有本地存储器的第三图形装置;以及
具有本地存储器的第四图形装置,其中所述单个虚拟分配被提...

【专利技术属性】
技术研发人员:Z·S·沃特斯T·施吕斯勒M·阿波达卡A·沙
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1