【技术实现步骤摘要】
协同GPU求解PDEs的影像输出方法、装置
本专利技术关于一种协同GPU作为求解偏微分方程式(PartialDifferentialEquations,PDEs)的高效能运算与三维互动影像输出的方法、装置,特别是指完全由GPU进行PDEs的运算,并根据运算结果完全由GPU绘制具有物理量变化的三维互动影像及输出。
技术介绍
由于科技发展的日新月异,高效能运算已经被广泛的应用在与民生息息相关的研究,如医疗诊断、3D互动式教学、全球气候变迁、台风、海啸、地震等天然灾害能量传递及破坏效果的预测。因此,大尺度计算模拟的重要性逐渐受到重视。凭借着低成本及低耗电量的优势,GPU衍然成为可以取代CPU作为高效能算的另类选择。又针对模拟边界条件的建立而言,扩增实境(AugmentedReality,AR)影像是一种新颖且快速的影像输入方法,可以建立许多用于模拟的模型,例如建筑物,人体器官或大自然环境等等。然而目前使用GPU作为求解偏微分方程式的高效能运算的方法,传统上只有将一部分工作由GPU装置执行,如图5所示,图示中CPU与GPU的协同运算过程中:虚线方块代表CPU要求GPU执行 ...
【技术保护点】
协同GPU求解PDEs的影像输出方法,其特征在于:包括以下步骤:A.由CPU执行一三维影像的座标转换,并根据座标转换结果设定模拟所需的边界条件,以及将边界条件输入至GPU;B.GPU根据步骤A提供的边界条件执行一偏微分方程式的数值模拟;C.GPU依据数值模拟结果计算绘图元素,而绘制具有物理量变化的视觉影像迭合在前述三维影像上,形成三维互动影像由一显示单元输出。
【技术特征摘要】
2011.11.21 TW 1001425341.协同GPU求解PDEs的影像输出方法,其特征在于:包括以下步骤:A.由CPU执行一三维影像的座标转换,并根据座标转换结果设定模拟所需的边界条件,以及将边界条件输入至GPU;B.GPU根据步骤A提供的边界条件执行一偏微分方程式的数值模拟,所述偏微分方程式的数值模拟包括:海啸、地震、台风的能量的传递及破坏效果的模拟;或是涉及震动下的金属疲劳模拟、建筑物耐震强度的模拟;或是涉及交通载具的空气阻力模拟;或是涉及撞击破坏的模拟;数值模拟系使用有限体积法,包含计算有限体积法的分离通量及计算有限体积法的状态,且GPU使用单一计算单元进行分离通量的计算;C.GPU依据数值模拟结果计算绘图元素,而绘制具有物理量变化的视觉影像迭合在前述三维影像上,形成三维互动影像由一显示单元输出,并且GPU结合CUDA语法加速计算速度Rendering,主要是使用CUDA语法核心从结构记忆空间来处理资料,并执行次要的索引转换,然后CUDA语法核心重新定义颜色及顶点,并在Rendering之前,将资料储存于整体记忆空间;加速后的加速比例为:Gustafson’sLaw:SU=a+P(1-a)其中SU表示加速比例(Speed-Up),a表示计算过程不能被平行运算的部份(fractionofworkthatcannotbeparallelized),P表示处理器数量(numberofprocessors),令初始化过程需耗费资源为:FINIT=kINITN其中N为计算单元(cells)数量,KINIT为每个计算单元初始化过程需耗费资源,假设执行工作A及工作B所需耗费资源与N呈线性关系:FA=kANFB=kBN其中kA及kB为每个计算单元计算过程中需耗费资源,令CPU与GPU之间的沟通(Communications)需耗费资源为:FCOM=kCOMN其中KCOM为每个计算单元在CPU与GPU之间的沟通需耗费资源,则由Gustafson’sLaw得到:(I)当工作A及工作B由CPU及GPU作平行运算,即CPU与GPU各别处理部份的PDEs运算与部份的绘图输出时:及(II)当工作A及工作B完全由GPU作平行运算,即完全由GPU处理PDEs运算与绘图输出时:及我们并定义:其中SUR表示完全由GPU作平行运算与由CPU及GPU同时作平行运算时的加速比例,可得到:化简后得到:2.如权利要求1所述的协同GPU求解PDEs的影像输出方法,其特征在于:在步骤B及步骤C中,CPU及GPU之间的资料传输仅涉及CPU传输工作指令至GPU,以及GPU完成工作后,传输回馈指令至CPU。3.如权利要求1所述的协同GPU求解PDEs的影像输出方法,其特征在于:其中步骤A的三维影像系由一摄影单元拍摄一标记的拍摄影像所产生的扩增实境影像。4.如权利要求3所述的协同GPU求解PDEs的影像输出方法,其特征在于:其中该标记为实体物或投影影像。5.如权利要求3所述的协同GPU求解PDEs的影像输出方法,其特征在于:在执行步骤A之前,先由CPU执行电脑系统程序初始化设定工作,包括有下列步骤:A1.在前述显示单元显示绘图应用程序被初始化;A2.CPU指定电脑主机所需的记忆体空间;A3.将所需模拟的偏微分方程式复制到GPU的记忆体空间;A4.使用扩增实境工具启动该摄影单元。6.如权利要求3所述的协同GPU求解PDEs的影像输出方法,其特征在于:在步骤C之后,包含有步骤D:由CPU执行电脑系统程序结束工作,包括下列步骤:D1.释放GPU的记忆体空间;D2.释放电脑主机的记忆体空间;D3.结束该摄影单元的操作;D4.结束该显示单元的操作。7.协同GPU求解PDEs的影像输出装置,其特征在于:包括有:一电脑主机,该电脑主机包括有一CPU、一GPU及一应用程序被安装于该电脑主机;一显示单元,电性连接该电脑主机;该应用程...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。