支持多个图形处理单元的方法与系统技术方案

技术编号:2947300 阅读:121 留言:0更新日期:2012-04-11 18:40
一种支持多个图型处理单元方法与系统,包含第一通讯路径,用以连接根复合装置与第一图型处理单元的第一连接接口;第二通讯路径,用以连接根复合装置与第一转换器集合;第一转换器集合,用以配置根复合装置通过第二转换器集合路由至第一图型处理单元的第二连接接口的通讯,或是配置根复合装置路由至第二图型处理单元的第一连接接口的通讯;第二转换器集合,用以配置与第一图型处理单元的第二连接接口之间的通讯,以及第二转换器集合通过第一转换器集合至根复合装置的通讯,或是第二转换器集合至第二图型处理单元的第二连接接口的通讯。

【技术实现步骤摘要】

本专利技术是关于一种图形处理,特别是一种通过转换一个链路至多个链路以支持多个图形处理单元的方法与系统
技术介绍
图形显示于计算机应用的需求已日益增长,其带动了更高阶图形处理能力的发展。计算机应用如计算机游戏,通常必须进行大量的计算以呈现复杂与高细致的图形,因此,可通过提升图形计算能力以及改变计算机内部结构来符合消费者所需。特别是个人计算机,为了满足娱乐与多媒体应用,例如高分辨率视频与最新的3D游戏,其设计导向已着重于增加系统频宽。而用来符合此设计需求所提出的方法是以释放所需的频宽供应目前的应用,除此之外,更保留额外的频宽供未来应用所需。近年来,计算机内部的主机板的总线系统已实现频宽扩增。其中总线系统是由构成主机板的印刷电路板上的固线式导体所组成,总线系统通常被分成两个通道,一个是用来传输数据,另一个是用来管理数据传输。更明确地说,总线系统的设计是用来处理任何连接至计算机的设备与计算机内部的处理器以及存储器之间的数据传输。总线系统例如周边控制器接口(Peripheral Component Interface,PCI)总线,用以连接输入/输出(input/output,I/O)设备与计算机。PCI总线是通过为I/O设备产生一个链路来实现连接至计算机内部中具有32位总线与工作频率33MHz的南桥芯片(south bridge chip)。PCI总线的工作频率是33MHz,而数据传输率能够达到133MB/s,后者亦可视为总频宽。对早期利用PCI总线的应用而言,这个总频宽是足够的,然而,对最近的应用而言,这个总频宽却是相当不足,因而局限了这些应用的效能。而后,一种新的接口,称为加速图形端口(Accelerated Graphics Port,AGP),是被导入3D图形的应用。绘图卡通过AGP接口连接于计算机,可提供至8倍频(8x)的工作频率继而实现约2.1GB/s的总频宽(数据传输率),因此,相较于前述的PCI总线则有相当可观的频宽增加。最近,更有一种新型的总线以超越PCI总线与AGP接口的总频宽出现,称为快捷PCI(PCI Express,PCIe),其典型的总频宽可达2.5GB/s,或是每单一方向的通道(lane)可达250MB/s,因此在二十个双向通道的模式中,总频宽可高达10GB/s。PCIe架构使用一种序列式互连技术,其能够维持于处理器以及存储器的工作速度。当总频宽达到前述的2.5GB/s时,仅需工作电压0.8V。从技术的弹性层面来看,PCIe架构具有速度可调整的优点,也就是说,利用多个通道的搭配来建立链路,PCIe链路因此能够从具有一个PCIe通道(即一倍速或x1)支持至具有两个PCIe通道(即二倍速或x2)、四个PCIe通道(即四倍速或x4)、八个PCIe通道(即八倍速或x8)、十二个PCIe通道(即十二倍速或x12)、十六个PCIe通道(即十六倍速或x16)、以及三十二个PCIe通道(即三十二倍速或x32)。然而,在许多桌上型计算机的应用中,主机板则普遍于兼容PCIe的绘图卡内配置具有一个具有一个PCIe通道的链路且/或一个至两个具有十六个PCIe通道的链路。请参照图1,为已知的计算机系统10内部示意图。其中,计算机系统10内部的中央处理单元(Central Processing Unit,CPU)12连接至通讯总线系统,例如PCIe总线。在此已知技术中,北桥芯片(north bridge chip)14与南桥芯片16利用不同的高速路径18、20的总线桥接架构与中央处理单元12连接以及彼此互连。如图1所示,至少一个接口设备22a~22d通过个别的点对点数据通道对与北桥芯片14连接,分别为具有一个PCIe通道24a~24d。同样地,至少一个接口设备28a~28b通过个别的PCIe通道26a~26d与南桥芯片16连接。另一方面,图形处理单元(Graphics Processing Unit,GPU)30通过一个具有十六个PCIe通道的链路(1×16 PCIe link或x×2n PCIe link,其中x=1;n=8)32与北桥芯片14连接,基本上,此链路可视为具有十六个一倍速的PCIe通道的链路(16×1 PCIe link),而其频宽约有4GB/s。尽管有PCIe通道与其它高频宽链路的支持,但是如图形处理单元30的图形处理装置的处理能力不足,仍旧导致图形应用不时遇到限制。基于此因素,计算机制造商与图形处理装置制造商寻求解决之道,即扩充第二个图形处理单元于硬件架构中,以进一步辅助复杂的图形应用的呈现,如应用在3D计算机游戏与高画质视频等。然而,于多个图形处理单元的应用中,各个图形处理单元之间的内部沟通的方法已为硬件设计者产生许多的问题。请参照图2,为另一已知的计算机系统34内部示意图。在此已知技术中,图形处理的运作是由两图形处理单元30、36负责,在非限定的例子中,其分别通过八倍速的PCIe通道33、38与北桥芯片14连接,是利用一个适时的图形处理运作的方法,使得图形处理单元30、36能彼此沟通,也不至于发生重复计算的情形。因此,在此应用中,图形处理单元30、36的运作应该要能够彼此相互协调一致。如图2所示,计算机系统34配置图形处理单元30、36通过系统存储器42而达成沟通,系统存储器42是通过一倍速的PCIe通道44、47与北桥芯片14连接。于此架构中,图形处理单元30通过PCIe通道33至北桥芯片14而与图形处理单元36沟通,再通过PCIe通道44传递至系统存储器42。之后,再通过PCIe通道47回到北桥芯片14,再经过八倍速的PCIe通道38至图形处理单元36。在此架构中,图形处理单元30、36之中每一个皆通过八倍速的PCIe通道33、36共享八倍速的PCIe频宽,也因此会消耗一些用做图形表现的频宽。并且,由于通过北桥芯片14与系统存储器42的传递,图形处理单元33、36之间的互联可能会遭遇到较长的时间延迟,除此之外,此架构还可能因系统存储器42有额外的流量而使效能变得更糟。请参照图3,为另一已知的计算机系统40内部示意图。在此已知技术中,仍支持前述的多个图形处理单元30、36,北桥芯片14分别通过具有八个PCIe通道的链路33与另一具有八个PCIe通道的链路38与图形处理单元30、36连接,而使其得到支持。北桥芯片14与图形处理单元30、36之间支持点对点通讯,是于北桥芯片14内配置附加的逻辑门来实现此架构,却因此降低了北桥芯片14的执行效能。另一方面,图形处理单元30、36的互联亦遭遇到如图2的已知技术中的时间延迟,因此已知的计算机系统40仍不尽理想与令人满意。因此,至目前为止仍无技术可用以克服上述已知技术中不足之处及其缺点。
技术实现思路
为了解决上述的问题,本专利技术揭露一种支持多个图形处理单元的系统与方法,是针对一个或多个绘图卡与一个主机板连接。于本专利技术中,第一通讯路径用以连接根复合装置(root complex device)(或北桥芯片)与第一图形处理单元的第一连接点。于本专利技术的具体实施例中,八个PCIe通道用以连接第一图形处理单元的连接脚位0~7与根复合装置的连接脚位0~7。第二通讯路径用以连接根复合装置与第一转换器集合。第一转换器集合则用以路由根复合装置经由第二本文档来自技高网
...

【技术保护点】
一种支持多个图形处理单元的系统,包括有:第一通讯路径,用以连接根复合装置与第一图形处理单元的第一连接界面;第一转换器集合,是与第二通讯路径连接,用以配置该根复合装置与该第一图形处理单元的第二连接接口之间的路由通讯或配置该根复 合装置与第二图形处理单元的第一连接接口之间的路由通讯;以及第二转换器集合,是与该第一图形处理单元的该第二连接接口连接,用以配置该第一图形处理单元的该第二连接接口与该根复合装置之间的路由通讯或配置该第一图形处理单元的该第二连接接口与该 第二图形处理单元的该第二连接接口之间的路由通讯。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:孔德海陈文中陈平郑智月麦达生刘西张黎孙莉刘成刚
申请(专利权)人:威盛电子股份有限公司
类型:发明
国别省市:71[中国|台湾]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利