当前位置: 首页 > 专利查询>辉达公司专利>正文

不对称多GPU处理制造技术

技术编号:2946606 阅读:259 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种用于处理视频数据的系统,其包括:一主处理器;一第一媒体处理装置,其耦合到一第一缓冲区,所述第一媒体处理装置经配置以对一视频数据帧执行一第一处理任务;和一第二媒体处理装置,其耦合到一第二缓冲区,所述第二媒体处理装置经配置以对所述经处理的视频数据帧执行一第二处理任务。所述结构允许所述两个装置具有不对称的视频处理能力。因此,根据每个装置的各自能力,所述第一装置可有利地执行一第一任务(例如解码),而所述第二装置执行一第二任务(例如后处理),从而相对于现有技术系统来说增加了处理效率。另外,一个驱动程序可用于两个装置,使得应用程序能利用所述系统的加速处理能力而不需要代码变化。

【技术实现步骤摘要】

本专利技术实施例一般来说涉及计算机图形,且更具体地说,涉及不对称多GPU处理
技术介绍
计算机图形图像数据通常在被显示于显示装置上之前经历若干处理步骤。每个处理步骤进一步细化图像数据,然而,每个处理步骤也增加了每个数据帧所需的处理时间。举例来说,典型的处理步骤包括二维(2-D)和三维(3-D)处理。一子组计算机图形数据是视频图像数据。同样可由若干处理步骤来处理视频图像数据。视频图像数据的一个实例是与数字视频光盘(DVD)有关的图像数据。与典型的计算机图形图像数据不同,视频图像数据是以每秒六十帧显示的。因此,针对视频数据的视频图像处理程序的执行时间必须小于显示一个视频数据帧所需的时间(大约16.67毫秒)。如果处理一视频数据帧所需的时间大于显示一视频数据帧所需的时间,那么不能显示经处理的视频数据。而是,通常展示先前视频数据来代替当前视频数据。这种现象通常被称为“丢失(dropping)”视频帧,且是非常不合需要的,因为其导致不良视频质量。图形处理单元(GPU)通常经配置以提供视频图像处理,在视频图像数据可被显示之前所述数据需要所述视频图像处理。举例来说,GPU可经配置以使用其3-D处理单元和2-D处理单元来处理视频图像数据。由于如上所述,显示帧速率限制了可用于处理每个帧的时间量,且由于每个视频图像处理任务增加了总处理时间,因而限制了可在单个GPU上执行的图像处理程序的数目和复杂性。加剧此问题的是这样一个事实,即高清晰度视频图像需要处理的像素比标准清晰度图像多出高达六倍。增加像素数增加了执行每个处理程序所需的时间量,从而进一步限制了单个GPU可在不丢失视频帧的情况向一图像数据帧施加的视频图像处理程序的数目。减少总处理时间的一种方法是配置多个GPU来并行运作以处理单个视频帧。这种方法一般需要使用功能相同的GPU来同时处理一视频帧的不同部分,以增加视频处理系统的处理量。这种方法的一个缺点在于将GPU限制为功能相同的。举例来说,如果计算系统包括第一GPU,且用户想要添加第二GPU,除非用户添加与第一GPU功能相同的第二GPU,否则GPU不能像此方法预想的那样并行运作。如前文说明,此项技术需要一种在不对视频处理系统施加此类不良设计限制的情况下增加视频处理量的方式。
技术实现思路
本专利技术一个实施例陈述一种用于处理视频数据的系统。所述系统包括主处理器和第一媒体处理装置,所述第一媒体处理装置耦合到第一缓冲区,其中所述第一缓冲区经配置以存储一视频数据帧,且所述第一媒体处理装置经配置以对所述视频数据帧执行第一处理任务。所述系统还包括第二媒体处理装置,其耦合到第二缓冲区,其中所述第二缓冲区经配置以存储所述经处理的视频数据帧,且所述第二媒体处理装置经配置以对所述经处理的视频数据帧执行第二处理任务。所揭示的系统的一个优点在于可将整个视频处理划分成若干单独视频处理任务,其中所述第一媒体处理装置对所述视频数据帧执行一个视频处理任务(例如,解码),而第二媒体处理装置对所述视频数据帧执行另一视频处理任务(例如,后处理操作)。使用这种方法,可由媒体处理装置同时处理多个视频帧,从而相对于现有技术视频处理系统来说增加了总处理效率。附图说明为了能详细了解本专利技术的上述特征,可参考实施例来对上文简要概述的本专利技术作更具体的描述,在附图中说明某些实施例。然而,应注意到,附图只说明本专利技术的典型实施例,且因此不应认为附图限制本专利技术范围,因为本专利技术可允许其它同样有效的实施例。图1是经配置以实施本专利技术一个或一个以上方面的计算装置的概念图;图2是根据本专利技术一个实施例的图1计算装置的更详细图;图3是根据本专利技术一个实施例说明软件驱动程序如何在第一GPU与第二GPU之间分配视频处理任务的概念图;图4是根据本专利技术一个实施例的用于产生GPU命令缓冲区和界定缓冲区的方法步骤流程图;和图5A和5B是根据本专利技术一个实施例的含有一命令序列的命令缓冲区的概念图,所述命令使第一GPU和第二GPU同步。具体实施例方式本专利技术通过在两个或两个以上GPU之间分配各种图像处理任务而减少处理图像数据(例如视频图像数据)所需的总时间。软件驱动程序可经配置以通过将每个特定处理任务匹配到最适合所述任务的GPU来优化针对个别GPU的处理任务分配。图1是经配置以实施本专利技术的一个或一个以上方面的计算装置100的概念图。所述计算装置100包括(但不限于)中央处理单元(CPU)102、系统存储器104、总线接口108、第一图形子系统110和第二图形子系统112。所述计算装置100可以是桌上型计算机、服务器、膝上型计算机、掌上型计算机、平板计算机、游戏控制台、蜂窝式电话、基于计算机的模拟器等。CPU102可用于执行软件程序(例如软件驱动程序106),所述软件驱动程序配置图形子系统110和112以处理图像数据。CPU102耦合到系统存储器104,所述系统存储器104可用于存储数据和程序(例如软件驱动程序106)。CPU102进一步耦合到系统接口108,所述系统接口108可以是桥接装置和/或输入/输出接口。所述系统接口108还耦合到第一图形子系统110和第二图形子系统112。第一图形子系统110包括第一GPU120,其耦合到第一GPU存储器124,所述第一GPU存储器124经配置以存储图形程序、命令和图像数据。第一GPU120包括数字到模拟转换器(DAC)122。传统上,DAC用于将经模拟处理的图像数据从GPU传输到显示装置(例如VGA可行监视器)。用于传输经处理的图像数据的其它构件包括数字视频接口(DVI)和串行数字接口(SDI)。这些其它构件现通常包括在DAC内。显示装置耦合到DAC122(未图示)以用于在完成处理时显示视频图像。第二图形子系统112包括第二GPU130,其耦合到第二GPU存储器134且包括DAC132。重要的是,此第二GPU130不必与第一GPU120功能相同,意味着所述两个GPU可具有不同的处理能力。另外,第二GPU存储器134不需要与第一GPU存储器124具有相同大小。下文结合图2更详细地描述第一GPU120与第二GPU130之间以及第一GPU存储器124与第二GPU存储器134之间的差异。然而,所属领域的技术人员将了解到,在特定实施例中,所述两个GPU可以是功能相同的且/或所述两个GPU存储器可以是大小相同的。通常,在视频图像数据可被显示之前,对所述数据执行若干单独处理步骤。举例来说,视频图像数据在被显示之前可能需要解码且接着需要后处理(post processing)。在具有多个能够处理视频图像数据的GPU的系统(例如计算装置100)中,可由所述可用GPU中的一者(例如第二GPU130)内的视频处理功能单元提供用于解码视频图像数据的功能性。另一方面,另一可用GPU(例如第一GPU120)内的3-D功能单元可提供后处理功能性。例如解码和后处理的任务一般是独立的,且不需要同时发生。因此,如本文更详细描述,软件驱动程序106可利用特定计算装置中GPU的非对称性质,并设法将每个图像处理步骤分派给最适合所述特定步骤的GPU。图2是根据本专利技术一个实施例的图1计算装置100的更详细图。具体地说,更详细地说明第一GPU120、第二GPU130、第一GPU存储器124和第二GPU存储器134。本文档来自技高网
...

【技术保护点】
一种用于处理视频数据的系统,所述系统包含:    一主处理器;    一第一媒体处理装置,其耦合到一第一缓冲区,其中所述第一缓冲区经配置以存储一视频数据帧,且所述第一媒体处理装置经配置以对所述视频数据帧执行一第一处理任务;和    一第二媒体处理装置,其耦合到一第二缓冲区,其中所述第二缓冲区经配置以存储所述经处理的视频数据帧,且所述第二媒体处理装置经配置以对所述经处理的视频数据帧执行一第二处理任务。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:弗兰克R迪亚尔哈桑S阿扎尔
申请(专利权)人:辉达公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利