当前位置: 首页 > 专利查询>迈克尔F迪林专利>正文

用于由多个互连节点执行渲染计算来渲染图形的方法和系统技术方案

技术编号:2860658 阅读:234 留言:0更新日期:2012-04-11 18:40
一种高速环拓扑。在一个实施例中,需要两种基本芯片类型:“绘图”芯片:环路绘制,和“接口”芯片:环路接口。这些芯片每一个都具有一组引脚,这些引脚支持同等高速点对点单向输入和输出环互连接口:环路链接。环路绘制芯片使用附加的引脚以连接至组成高带宽局部存储器子系统的几个标准存储器。环路接口芯片使用附加的引脚以支持高速主机主接口、至少一个视频输出接口以及可能也附加的到其他环路接口芯片的非局部互连。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及计算机图形领域,尤其涉及3d图形硬件加速器。
技术介绍
大多数传统的通用计算机具有一些形式的硬件子系统,这些子系统能够将计算机内存储或计算的信息与一些形式的物理图像显示设备结合,作为对用户的交互可视反馈。十年以前,这些与计算机相连接的物理图像显示设备和特殊的电子设备是非常原始的,例如,闪烁的显示设备(blinking lights)、老式显示屏(“glass ttys”)或者示波器,随着时间的过去,技术更加完善了,用于驱动物理图像显示设备的硬件子系统或者图形系统已十分复杂了,尤其是凭借自身实力的计算系统。实际上,许多用于建立常规图形系统的现有的“图形芯片”比通用计算机中功能强大的单个芯片cpu包含更多的晶体管。特别是,图形系统不只是将主机连接至物理图像显示设备。它还从主机中卸下了越来越多的渲染操作,包括2d渲染和3d渲染。用于特殊任务的硬件加速器通常比在通用计算机中完全用软件执行相同的任务具有性能和/价格优势。这当然是假定在许多市场区域中存在充分的对于频繁地执行特殊任务(即需要2d和3d计算机图形的情形)的用户需求,包括工业市场和家庭娱乐用户。早期的图形系统只能进行简单的工作,绘制2d线条或文字,更先进的高性能图形系统能够担负从主机高水平表现三维物体,并执行大量的近似计算模拟的工作,模拟真实世界中的光子如何点亮物体组,以及这些物体的图像如何在物理摄像机或物理人眼的图像平面中形成。换言之,现代图形系统能够执行3d渲染。因此,与其用通用术语“图形系统”,不如将它们称为“3d图形硬件加速器”。最终的人造“图像平面”成为从3d图形硬件加速器向各种物理图像显示设备发送的用于由用户观看的视频输出信号。这些物理图像显示设备包括(但不限于)直观式crt、直观式lcd面板、直观式等离子面板、直观式电场发光显示器、基于led的显示器、基于crt的放映机、基于lcd的放映机、基于lcos的放映机、基于dmd的放映机、基于激光的放映机以及头盔显示器(hmd)。功能越来越强的3d图形硬件加速器的最近的发展步调刺激了连续发展新的结构概念以建立3d图形硬件加速器的需要,3d图形硬件加速器能够产生大量比用以前的结构概念所能产生的图像更丰富的3d物体的图像。当基于功能更强的半导体芯片的新构件将得到使用时(即便在几年以后),用于建立最高性能3d图形硬件加速器的结构概念可能将不再适用。同时,假设开发不同芯片的成本也在增加,那么也期望得到具有高缩放性的3d图形硬件加速器结构,也就是说,即允许从同样小的芯片组构造在许多不同的价格/性能点的宽范围的商业可行产品。特别是极其期望两个特性在下一个十年中支持高性能3d图形硬件加速器的价值,这两个特性是完全可编程光影和高质量抗混淆。高质量抗混淆通过减少或消除大多数现有的3d图形硬件加速器都会产生的所谓的“锯齿”产生更逼真的视觉图像。为了达到这种高质量,3d图形硬件加速器必须能够支持更复杂的帧缓冲器,在帧缓冲器中必须为正在渲染的图像中的每一个像素保持大量的样本。在某种程度上,这种结构也必须支持在产生视频输出信号之前对这些样本的有效的抗混淆滤波。大多数用于实时交互的常规3d图形硬件加速器,要么不能提供对每个像素保持多个样本的支持,要么只能支持非常有限的样本密度,例如2个或4个,偶尔达到8个。这些系统在视频输出信号产生过程中也仅能支持对这些样本的极其有限形式的抗混淆滤波。例如,通常抗混淆滤波仅限于一个像素一个像素的箱式滤波。对于将来的系统,将极有利地支持每像素16个样本,和每像素32、48或者甚至64个样本,或者在高级情形下更高。这些样本密度必须不仅支持低分辨率视频信号格式,例如ntsc,还要支持高清晰度格式,例如hdtv和2百万像素计算机视频信号格式。期望信号处理支持至少四乘四像素的具有负半周(negative lobes)的三次方滤波抗混淆滤波,和在高级情形中更大面积的抗混淆滤波,例如,8×8像素或更高。可编程光影是为十年使用的借助于3d软件渲染系统的技术,通用计算机每次工作几个小时或几天以产生单个最终渲染的图像。这些是产生最逼真的3d计算机图形图像的系统,而且这些图像的用处现在是在许多电影的特效创作中所必需的。观点是当大量所谓的“图形管线”已经确定了不能更改的功能时,再管线中特定的“关键”点具有对于应用要使用的特殊图形算法的选项。这支持最终渲染图像中更逼真的效果。例如,对于警察、消防队员和医护人员的事故训练,在训练场景中精确模拟降低紧急事件工作人员的可视度的烟和灰尘的效果,它可能是非常重要的。可编程光影已经作为自定义3d图形硬件加速器的视觉输出的好技术而显露出来。用于实时交互的常规3d图形硬件加速器仅仅开始提供对可编程光影的非常有限的支持。目前市场上最复杂的3d图形硬件加速器芯片在图形管线,像素着色器中最重要的点仅能支持八个指令步,而且不允许任何条件指令步。这对于向最终用户提供他们想要的灵活性和质量都是不够的。对于将来的系统,极其期望能够支持多得多的指令步,例如,几百到几千指令步,以及条件指令步。在常规低端3d图形硬件加速器中,例如,那些主要是针对用户家庭游戏市场的,系统结构的指令集(issues)是通过将3d图形硬件加速器的大多数指令限制在单个芯片中简化了的。在一个芯片内,总线和带宽的指令集不如芯片之间的指令集重要,而且所用的全部算法保持简单。结果,已经可能以用户市场价格建立功能适当强的系统,尽管仅限制在单个低成本芯片的处理能力。在中等范围和高端3d图形硬件加速器中,例如,那些针对汽车和飞机设计、医疗显像、石化产品显像、普通科学显像、飞行模拟和训练、数字内容创作(动画和电影编辑)、视频广播等专业市场的,只能通过建立更复杂的3d图形硬件加速器来满足用户的需求,这比单芯片更适合。例如,它们必须使用共同在一个系统内的大量芯片的计算能力。这个市场的几乎全部系统都需要建立大量不同的自定义芯片类型,并通常使用多个不同的自定义互连或总线以将这些芯片连接在一起从而建立功能系统。建立这些多互连或总线是昂贵的,不仅是因为芯片包上日益增多的针脚的成本和印刷电路板上导线和连接点的成本,还因为几个不同的自定义工艺的互连总线协议的设计和测试成本。在正常操作条件下,这些互连或总线中只有少数是运行在峰值速率下的;其他的总线是在使用以下的。因此,这些互连或总线的全部总计带宽的许多是曾经极少使用的,并潜在地代表浪费的产品工程和/或产品成本。由于市场上大多数是用于3d视频游戏应用的,目前的低端3d图形硬件加速器市场是非常受价格驱动的。这些3d图形硬件加速器要么是以低于$500PC的插卡出售,要么是作为低于$400游戏操纵台的主要部分。为了实现由这些价格点所暗示的低部分价格,这些市场的大多数3d图形硬件加速器结构由单个图形加速器asic构成,在其上附加有少量的dram芯片。其他的芯片(如果存在)是通用处理器或音频加速芯片,并且不直接连接包含帧缓冲器和纹理存储器的dram芯片。假设能够加到asic的针脚的数目限制在这个价格范围内,这些基于asic的单图形加速器系统的3d渲染性能的最好情形如前所述是受到约束的,这种约束是由对于3d渲染有多大带宽是可用的限制造成的,而且所用的dram芯片的带宽不多于加到asic的针脚本文档来自技高网...

【技术保护点】
一种渲染图形的方法,其包括:接收渲染图形场景所需要的信息;和响应接收的图形命令,向排列在环路中的多个图形芯片之一发送渲染图形场景的部分所必需的信息。

【技术特征摘要】
US 2002-3-22 60/367,0641.一种渲染图形的方法,其包括接收渲染图形场景所需要的信息;和响应接收的图形命令,向排列在环路中的多个图形芯片之一发送渲染图形场景的部分所必需的信息。2.如权利要求1所述的方法,其中,所述接收是由环路中的接口芯片执行的。3.如权利要求1所述的方法,其中,所述发送是由环路中的接口芯片执行的。4.如权利要求1所述的方法,其中,所述发送包括向环路中图形芯片的各个的多个芯片分发图形基元命令。5.如权利要求1所述的方法,其中,所述发送包括发送图形状态信息。6.如权利要求1所述的方法,其中,每个图形芯片包含帧缓冲器的交错部分。7.如权利要求1所述的方法,其中,所述发送进一步包括接口芯片使用负载平衡方法来决定多个图形芯片的哪个子集接收渲染图形场景的部分所必需的信息。8.如权利要求1所述的方法,其中,多个图形芯片之一接收渲染图形场景所需要的部分信息,并且如果该接收图形芯片不是最终目标就将该信息传递给环路中下一个图形芯片。9.一种由环路中的图形芯片执行的方法,其包括接收渲染图形场景的部分所必需的信息;执行对接收的信息的渲染处理的部分;和向环路中多个其他图形芯片的至少一个发送执行步骤的结果以继续渲染处理。10.如权利要求9所述的方法,其中,所述发送包括从接口芯片向图形芯片发送图形基元命令。11.如权利要求9所述的方法,其中,所述发送包括从接口芯片到图形芯片的状态信息。12.如权利要求9所述的方法,其中,所述接收的信息包含渲染基元对象的信息。13.如权利要求9所述的方法,其中,接口芯片分配环路中多个图形芯片的子集以渲染图形场景的部分。14.如权利要求9所述的方法,其中,所述渲染处理的部分包括剪辑检查操作。15.如权利要求9所述的方法,其中,所述渲染处理的部分如果需要包括剪辑操作。16.如权利要求9所述的方法,其中,所述渲染处理的部分包括顶点着色。17.如权利要求9所述的方法,其中,所述渲染处理的部分包括扫描转换。18.如权利要求9所述的方法,其中,所述渲染处理的部分包括将每个生成的像素提交给可编程像素着色器。19.如权利要求9所述的方法,其中,所述渲染处理的部分包括将每个生成的微多边形顶点提交给可编程着色器。20.如权利要求9所述的方法,其中,所述渲染处理的部分包括纹理操作。21.如权利要求9所述的方法,其中,所述渲染处理的部分包括位移贴图。22.如权利要求9所述的方法,其中,所述渲染处理的部分包括更高阶表面的铺嵌。23.如权利...

【专利技术属性】
技术研发人员:迈克尔F迪林迈克尔G拉韦尔
申请(专利权)人:迈克尔F迪林
类型:发明
国别省市:US[美国]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1