基于可重构数据流系统芯片阵列的3D图学渲染加速系统技术方案

技术编号：16780621 阅读：22 留言：0更新日期：2017-12-13 00:31

本发明专利技术提供了一种基于可重构数据流系统芯片阵列的3D图学渲染加速系统，包括：单核或多核的CPU芯片；N个3D图学渲染加速卡；带有N个PCIe插槽的母板；其中：N个3D图学渲染加速卡经由所述母板上的PCIe插槽以及PCIe总线与所述CPU芯片相连；每个3D图学渲染加速卡包括：一个3DX‑FPGA芯片阵列和M个SDRAM芯片；其中，所述3DX‑FPGA芯片阵列包括：X×Y个用于3D图学渲染加速的3DX‑FPGA芯片；所述SDRAM芯片用于存储3D数据；每个3DX‑FPGA芯片的逻辑由K个XPU模块组成，每个XPU模块由J个个射线跟踪核组成。本发明专利技术可取代传统的基于多核CPU或GPU群的超级计算机而在3D图学应用的速度、功耗、体积与成本上取得较好的效果。

全部详细技术资料下载

【技术实现步骤摘要】
基于可重构数据流系统芯片阵列的3D图学渲染加速系统
本专利技术涉及3D图学
，尤其涉及一种基于可重构数据流系统芯片阵列的3D图学渲染加速系统。
技术介绍
3D图学渲染技术是现今3D计算机图学(3DComputerGraphics)的应用中需求性最高的技术。这个技术的最高诉求是在实时应用中产生真实的视觉影像。朝着这个方向，3D图学渲染技术的实现至今有3种方式：1.基于中央处理器(CentralProcessingUnit，简称CPU)或图形处理器(GraphicProcessingUnit，简称GPU)的3D图学渲染技术。2.基于专用集成电路(Application-SpecificIntegratedCircuit，简称ASIC)芯片固定逻辑的3D图学渲染技术。3.基于FPGA芯片可重构逻辑的3D图学渲染技术。在许多大规模的3D应用中，最耗时间的任务是将3D影像的视觉信息表达在2D的平面上。尤其是在如3D工业设计、3D动画、3D电影特效编辑等的应用中做大规模、复杂的绘图设计(例如飞机、汽车的模型设计或城市景观设计)，能够迅速完成切面(CuttingPlane)、模型合并(ModelInterrogation)、复杂着色(SophisticatedShading)是一个基本的关键操作。这些不同的3D图学应用有一个共同的技术要求，就是高速的3D数字信号处理功能。在罗聪翼著的《Blender权威指南》书第7章第5节《渲染农场》中叙述：著名的电影特效工作室WetaDigital在制作电影《2012》(注：2009年美国科幻灾难片)的过程中，花费在单帧画面上的...
基于可重构数据流系统芯片阵列的3D图学渲染加速系统

【技术保护点】
一种基于可重构数据流系统芯片阵列的3D图学渲染加速系统，包括：单核或多核的CPU芯片；N个3D图学渲染加速卡；带有N个PCIe插槽的母板；其中：N个3D图学渲染加速卡经由所述母板上的PCIe插槽以及PCIe总线与所述CPU芯片相连；每个3D图学渲染加速卡包括：一个3DX‑FPGA芯片阵列和M个SDRAM芯片；其中，所述3DX‑FPGA芯片阵列包括：X×Y个用于3D图学渲染加速的3DX‑FPGA芯片；所述SDRAM芯片用于存储3D数据；每个3DX‑FPGA芯片的逻辑由K个XPU模块组成，每个XPU模块由J个射线跟踪核组成；其中，N、X、Y、M、K、J均为大于0的整数。

【技术特征摘要】
1.一种基于可重构数据流系统芯片阵列的3D图学渲染加速系统，包括：单核或多核的CPU芯片；N个3D图学渲染加速卡；带有N个PCIe插槽的母板；其中：N个3D图学渲染加速卡经由所述母板上的PCIe插槽以及PCIe总线与所述CPU芯片相连；每个3D图学渲染加速卡包括：一个3DX-FPGA芯片阵列和M个SDRAM芯片；其中，所述3DX-FPGA芯片阵列包括：X×Y个用于3D图学渲染加速的3DX-FPGA芯片；所述SDRAM芯片用于存储3D数据；每个3DX-FPGA芯片的逻辑由K个XPU模块组成，每个XPU模块由J个射线跟踪核组成；其中，N、X、Y、M、K、J均为大于0的整数。2.根据权利要求1所述的3D图学渲染加速系统，还包括：GPU芯片，该GPU芯片经由PCIe总线与CPU芯片相连而成为CPU的协处理器。3.根据权利要求1所述的3D图学渲染加速系统，所述的3DX-FPGA芯片阵列包含的X×Y个3DX-FPGA芯片利用3D图学渲染加速卡上的焊接金属线以X-Y矩阵的形式连接。4.根据权利要求1所述的3D图学渲染加速系统，所述3DX-FPGA芯片的设计流程分成两部分：应用逻辑部分与应用平台部分，其中：所述应用逻辑部分采取3D数据流机(3DDataflowMachine)的硬件语言(HardwareDescriptionLanguage，简称HDL)的设计流程；所述应用平台部分采取3DX-FPGA全能设计流程(VersatileDesignSystem，简称VDS)。5.根据权利要求1所述的3D图学渲染加速系统，所述3DX-FPGA芯片是一个具有两层逻辑结构的电路；其中，上层的可重构层电路与下层的逻辑层电路并存而相互叠加成为一体，形成一个平行叠加而相互信号紧密连接的完整应用电路。6.根据权利要求5所述的3D图学渲染加速系统，所述的逻辑层电路是一个以X-Y二维矩阵形式排列的逻辑模块阵列；其中，该逻辑模块阵列包括：一个四面环绕的可重构输入-输出模块环(ReconfigurableInput-OutputBlockRing)；以及一个被可重构输入-输出模块环包围的可重构核心逻辑矩阵模块阵列(ReconfigurableCoreLogicMatrixBlockArray)。7.根据权利要求6所述的3D图学渲染加速系统，所述的可重构输入-输出模块环由多种不同型的输入-输出模块组成；各个不同型的输入-输出模块的功能为实时可重构(real-timereconfigurable)，即各个不同输入-输出模块体现在应用中的功能由它在3D图学渲染计算加速中的功能需求实时决定。8.根据权利要求7所述的3D图学渲染加速系统，所述的可重构核心逻辑矩阵模块阵列由3DX-FPGA芯片上层的可重构层电路控制而重构为5个不同的巨函数模块(MegafunctionBlock)：A.PCIEC(PCIECore)巨函数模块，其功能为：基于PCIE总线协议的DMA(DirectMemoryAccess)；B.PCIEA(PCIEApplication)巨函数模块，其功能为：读写DMA数据并分配至寄存器与RAM块(RAMBlock，简称RAMB)；C.SDCTL(SDRAMControl)巨函数模块，其功能为：3DX-FPGA外SDRAM的控制；D.CACHE(CacheMemoryandCacheControl)巨函数模块，其功能为：3D数据中间缓存与控制；E.RENDER(RenderFrame)，其功能为：3D渲染计算模块；其中，每一个巨函数模块都是根据不同的应用规格而可重构的。9.根据权利要求8所述的3D图学渲染加速系统，所述的PCIEC巨函数模块包括2个巨函数子模块(MegafunctionSub-Block)：PCIEIF(PCIEInterface)巨函数子模块，其功能为：与PCIe总线相连，负责DMA巨函数子模块对PCIe总线的数据进出；DMA(DirectMemoryAccess)巨函数子模块，其功能为：与PCIEAPPRT巨函数子模块相连，负责主内存与PCIEAPPRT巨函数子模块之间的大量数据进出的控制。10.根据权利要求8所述的3D图学渲染加速系统，所述的PCIEA巨函数模块包括3个巨函数子模块：PCIEAPPRT(PCIEAPPRAYTRACE)巨函数子模块，其功能为：与LOADREG、LOADRAMB二巨函数子模块相连，负责主内存的大量数据进出LOADREG、LOADRAMB的分流/合流(multiplexing/de-multiplexing)；LOADREG(LOADREGISTER)巨函数子模块，其功能为：送给或收自主内存的寄存器数据；LOADRAMB(LOADRAMB)巨函数子模块，其功能为：送给或收自主内存的存储器数据。11.根据权利要求8所述的3D图学渲染加速系统，所述的SDCTL巨函数模块包括5个巨函数子模块：SDCTL_FB(SDRAMCONTROLFB)巨函数子模块，其功能为：与外部的FB_SDRAM相连，负责外部的FB_SDRAM的数据读与写；SDCTL_KD(SDRAMCONTROLKD)巨函数子模块，其功能为：与外部的KD_SDRAM相连，负责外部的KD_SDRAM的数据读与写；SDCTL_PRIMO(SDRAMCONTROLPRIMO)巨函数子模块，其功能为：与外部的PRIMO_SDRAM相连，负责外部的PRIMO_SDRAM的数据读与写；SDCTL_PRIM1(SDRAMCONTROLPRIM1)巨函数子模块，其功能为：与外部的PRIM1_SDRAM相连，负责外部的PRIM1_SDRAM的数据读与写；SDCTL_TEXTURE(SDRAMCONTROLTEXTURE)巨函数子模块，其功能为：与外部的TEXTURE_SDRAM相连，负责外部的TEXTURE_SDRAM的数据读与写。12.根据权利要求8所述的3D图学渲染加速系统，所述的CACHE巨函数模块包括4个巨函数子模块：CACHE_TRAV(CACHETRAV)巨函数子模块，其功能为：中间缓存应TRAV模块逻辑要求而来自外部KD_SDRAM的数据；CACHE_LIST(CACHELIST)巨函数子模块，其功能为：中间缓存应LIST模块逻辑要求而来自外部PRIMO_SDRAM的数据；CACHE_INT(CACHEINT)巨函数子模块，其功能为：中间缓存应INT模块逻辑要求而来自外部PRIM1_SDRAM的数据；CACHE_SHADE(CACHESHADE)巨函数子模块，其功能为：中间缓存应SHADE模块逻辑要求而来自外部TEXTURE_SDRAM的数据。13.根据权利要求8所述的3D图学渲染加速系统，所述的RENDER巨函数模块包括7个巨函数子模块：RENDER_RAYGEN(RENDERRAYGEN)巨函数子模块，其功能为：计算并产生帧渲染(FRAMERENDER)模块所需的穿过一个像素块(PixelTile)的主射线(PrimaryRay)；RENDER_T...

【专利技术属性】
技术研发人员：陈陵都，
申请(专利权)人：南京华磊易晶微电子有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人