【技术实现步骤摘要】
基于可重构数据流系统芯片阵列的3D图学渲染加速系统
本专利技术涉及3D图学
,尤其涉及一种基于可重构数据流系统芯片阵列的3D图学渲染加速系统。
技术介绍
3D图学渲染技术是现今3D计算机图学(3DComputerGraphics)的应用中需求性最高的技术。这个技术的最高诉求是在实时应用中产生真实的视觉影像。朝着这个方向,3D图学渲染技术的实现至今有3种方式:1.基于中央处理器(CentralProcessingUnit,简称CPU)或图形处理器(GraphicProcessingUnit,简称GPU)的3D图学渲染技术。2.基于专用集成电路(Application-SpecificIntegratedCircuit,简称ASIC)芯片固定逻辑的3D图学渲染技术。3.基于FPGA芯片可重构逻辑的3D图学渲染技术。在许多大规模的3D应用中,最耗时间的任务是将3D影像的视觉信息表达在2D的平面上。尤其是在如3D工业设计、3D动画、3D电影特效编辑等的应用中做大规模、复杂的绘图设计(例如飞机、汽车的模型设计或城市景观设计),能够迅速完成切面(CuttingPlane)、模型合并(ModelInterrogation)、复杂着色(SophisticatedShading)是一个基本的关键操作。这些不同的3D图学应用有一个共同的技术要求,就是高速的3D数字信号处理功能。在罗聪翼著的《Blender权威指南》书第7章第5节《渲染农场》中叙述:著名的电影特效工作室WetaDigital在制作电影《2012》(注:2009年美国科幻灾难片)的过程中,花费在单帧画面上的 ...
【技术保护点】
一种基于可重构数据流系统芯片阵列的3D图学渲染加速系统,包括:单核或多核的CPU芯片;N个3D图学渲染加速卡;带有N个PCIe插槽的母板;其中:N个3D图学渲染加速卡经由所述母板上的PCIe插槽以及PCIe总线与所述CPU芯片相连;每个3D图学渲染加速卡包括:一个3DX‑FPGA芯片阵列和M个SDRAM芯片;其中,所述3DX‑FPGA芯片阵列包括:X×Y个用于3D图学渲染加速的3DX‑FPGA芯片;所述SDRAM芯片用于存储3D数据;每个3DX‑FPGA芯片的逻辑由K个XPU模块组成,每个XPU模块由J个射线跟踪核组成;其中,N、X、Y、M、K、J均为大于0的整数。
【技术特征摘要】
1.一种基于可重构数据流系统芯片阵列的3D图学渲染加速系统,包括:单核或多核的CPU芯片;N个3D图学渲染加速卡;带有N个PCIe插槽的母板;其中:N个3D图学渲染加速卡经由所述母板上的PCIe插槽以及PCIe总线与所述CPU芯片相连;每个3D图学渲染加速卡包括:一个3DX-FPGA芯片阵列和M个SDRAM芯片;其中,所述3DX-FPGA芯片阵列包括:X×Y个用于3D图学渲染加速的3DX-FPGA芯片;所述SDRAM芯片用于存储3D数据;每个3DX-FPGA芯片的逻辑由K个XPU模块组成,每个XPU模块由J个射线跟踪核组成;其中,N、X、Y、M、K、J均为大于0的整数。2.根据权利要求1所述的3D图学渲染加速系统,还包括:GPU芯片,该GPU芯片经由PCIe总线与CPU芯片相连而成为CPU的协处理器。3.根据权利要求1所述的3D图学渲染加速系统,所述的3DX-FPGA芯片阵列包含的X×Y个3DX-FPGA芯片利用3D图学渲染加速卡上的焊接金属线以X-Y矩阵的形式连接。4.根据权利要求1所述的3D图学渲染加速系统,所述3DX-FPGA芯片的设计流程分成两部分:应用逻辑部分与应用平台部分,其中:所述应用逻辑部分采取3D数据流机(3DDataflowMachine)的硬件语言(HardwareDescriptionLanguage,简称HDL)的设计流程;所述应用平台部分采取3DX-FPGA全能设计流程(VersatileDesignSystem,简称VDS)。5.根据权利要求1所述的3D图学渲染加速系统,所述3DX-FPGA芯片是一个具有两层逻辑结构的电路;其中,上层的可重构层电路与下层的逻辑层电路并存而相互叠加成为一体,形成一个平行叠加而相互信号紧密连接的完整应用电路。6.根据权利要求5所述的3D图学渲染加速系统,所述的逻辑层电路是一个以X-Y二维矩阵形式排列的逻辑模块阵列;其中,该逻辑模块阵列包括:一个四面环绕的可重构输入-输出模块环(ReconfigurableInput-OutputBlockRing);以及一个被可重构输入-输出模块环包围的可重构核心逻辑矩阵模块阵列(ReconfigurableCoreLogicMatrixBlockArray)。7.根据权利要求6所述的3D图学渲染加速系统,所述的可重构输入-输出模块环由多种不同型的输入-输出模块组成;各个不同型的输入-输出模块的功能为实时可重构(real-timereconfigurable),即各个不同输入-输出模块体现在应用中的功能由它在3D图学渲染计算加速中的功能需求实时决定。8.根据权利要求7所述的3D图学渲染加速系统,所述的可重构核心逻辑矩阵模块阵列由3DX-FPGA芯片上层的可重构层电路控制而重构为5个不同的巨函数模块(MegafunctionBlock):A.PCIEC(PCIECore)巨函数模块,其功能为:基于PCIE总线协议的DMA(DirectMemoryAccess);B.PCIEA(PCIEApplication)巨函数模块,其功能为:读写DMA数据并分配至寄存器与RAM块(RAMBlock,简称RAMB);C.SDCTL(SDRAMControl)巨函数模块,其功能为:3DX-FPGA外SDRAM的控制;D.CACHE(CacheMemoryandCacheControl)巨函数模块,其功能为:3D数据中间缓存与控制;E.RENDER(RenderFrame),其功能为:3D渲染计算模块;其中,每一个巨函数模块都是根据不同的应用规格而可重构的。9.根据权利要求8所述的3D图学渲染加速系统,所述的PCIEC巨函数模块包括2个巨函数子模块(MegafunctionSub-Block):PCIEIF(PCIEInterface)巨函数子模块,其功能为:与PCIe总线相连,负责DMA巨函数子模块对PCIe总线的数据进出;DMA(DirectMemoryAccess)巨函数子模块,其功能为:与PCIEAPPRT巨函数子模块相连,负责主内存与PCIEAPPRT巨函数子模块之间的大量数据进出的控制。10.根据权利要求8所述的3D图学渲染加速系统,所述的PCIEA巨函数模块包括3个巨函数子模块:PCIEAPPRT(PCIEAPPRAYTRACE)巨函数子模块,其功能为:与LOADREG、LOADRAMB二巨函数子模块相连,负责主内存的大量数据进出LOADREG、LOADRAMB的分流/合流(multiplexing/de-multiplexing);LOADREG(LOADREGISTER)巨函数子模块,其功能为:送给或收自主内存的寄存器数据;LOADRAMB(LOADRAMB)巨函数子模块,其功能为:送给或收自主内存的存储器数据。11.根据权利要求8所述的3D图学渲染加速系统,所述的SDCTL巨函数模块包括5个巨函数子模块:SDCTL_FB(SDRAMCONTROLFB)巨函数子模块,其功能为:与外部的FB_SDRAM相连,负责外部的FB_SDRAM的数据读与写;SDCTL_KD(SDRAMCONTROLKD)巨函数子模块,其功能为:与外部的KD_SDRAM相连,负责外部的KD_SDRAM的数据读与写;SDCTL_PRIMO(SDRAMCONTROLPRIMO)巨函数子模块,其功能为:与外部的PRIMO_SDRAM相连,负责外部的PRIMO_SDRAM的数据读与写;SDCTL_PRIM1(SDRAMCONTROLPRIM1)巨函数子模块,其功能为:与外部的PRIM1_SDRAM相连,负责外部的PRIM1_SDRAM的数据读与写;SDCTL_TEXTURE(SDRAMCONTROLTEXTURE)巨函数子模块,其功能为:与外部的TEXTURE_SDRAM相连,负责外部的TEXTURE_SDRAM的数据读与写。12.根据权利要求8所述的3D图学渲染加速系统,所述的CACHE巨函数模块包括4个巨函数子模块:CACHE_TRAV(CACHETRAV)巨函数子模块,其功能为:中间缓存应TRAV模块逻辑要求而来自外部KD_SDRAM的数据;CACHE_LIST(CACHELIST)巨函数子模块,其功能为:中间缓存应LIST模块逻辑要求而来自外部PRIMO_SDRAM的数据;CACHE_INT(CACHEINT)巨函数子模块,其功能为:中间缓存应INT模块逻辑要求而来自外部PRIM1_SDRAM的数据;CACHE_SHADE(CACHESHADE)巨函数子模块,其功能为:中间缓存应SHADE模块逻辑要求而来自外部TEXTURE_SDRAM的数据。13.根据权利要求8所述的3D图学渲染加速系统,所述的RENDER巨函数模块包括7个巨函数子模块:RENDER_RAYGEN(RENDERRAYGEN)巨函数子模块,其功能为:计算并产生帧渲染(FRAMERENDER)模块所需的穿过一个像素块(PixelTile)的主射线(PrimaryRay);RENDER_T...
【专利技术属性】
技术研发人员:陈陵都,
申请(专利权)人:南京华磊易晶微电子有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。