Blender渲染在神威超算中的并行优化方法及系统技术方案

技术编号：37875203 阅读：7 留言：0更新日期：2023-06-15 21:03

本公开提供了一种Blender渲染在神威超算中的并行优化方法及系统，包括：获取Blender待渲染任务的渲染场景数据，并对所述渲染场景数据进行分割，其中，分割的数量基于神威超算中节点的核组数目确定；对于分割后的渲染场景数据，分别采用独立进程利用不同核组的计算资源进行场景渲染；其中，每个核组对应一个独立进程；当所有独立进程均计算完毕，将各个核组的渲染结果进行合并，获得最终的渲染结果；其中，针对Blender渲染计算过程中开启降噪功能的情况，采用数据重叠区的方式解决数据依赖问题。采用数据重叠区的方式解决数据依赖问题。采用数据重叠区的方式解决数据依赖问题。

全部详细技术资料下载

【技术实现步骤摘要】
Blender渲染在神威超算中的并行优化方法及系统

[0001]本公开属于应用软件移植优化
，尤其涉及一种Blender渲染在神威超算中的并行优化方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本公开相关的
技术介绍
信息，不必然构成在先技术。
[0003]对于一款常用的应用软件，往往不适用于新一代神威超算(即国产神威新一代超级计算机系统)的高效运行，需要做大量的移植优化工作，期间总是有算法的实现过程或方法需要更改。如Blender的软件用原有的方法，每次场景渲染过程中都是以线程技术实现为主并且将所有数据放入加速器中，由于神威的特性，在具有高性能计算的从核中因为内存限制是不能存储大规模数据的，因此不能全部接收渲染场景的数据；另外由于神威在设计上是一个核组有64从核和一个主核，一个节点(类似一个cpu)有六个核组，在原有的线程技术上不具有很好的扩展性。因此设计方案在需要保证从核能存储下的情况，充分利用多核组的资源，并具有高扩展性，专利技术人发现，实现软件在神威上的高效移植，存在如下问题：
[0004](1)在渲染的计算中，因为分配的数据不均衡，导致不能合理的利用从核资源，或因为数据无法同时存进从核中，从而通信开销增大，最终导致运行效率减慢现象，或因为blender运用线程技术，导致神威的pthread技术使用时更局部，从而导致进入从核的数据量变小，也会引起通信开销增大，从而也会降低运行效率，增大运行成本。
[0005](2)线程技术扩展性较差在CPU或GPU的架构中只能在单节点内...

【技术保护点】

【技术特征摘要】
1.一种Blender渲染在神威超算中的并行优化方法，其特征在于，包括：获取Blender待渲染任务的渲染场景数据，并对所述渲染场景数据进行分割，其中，分割的数量基于神威超算中节点的核组数目确定；对于分割后的渲染场景数据，分别采用独立进程利用不同核组的计算资源进行场景渲染；其中，每个核组对应一个独立进程；当所有独立进程均计算完毕，将各个核组的渲染结果进行合并，获得最终的渲染结果；其中，针对Blender渲染计算过程中开启降噪功能的情况，采用数据重叠区的方式解决数据依赖问题。2.如权利要求1所述的一种Blender渲染在神威超算中的并行优化方法，其特征在于，所述将各个核组的渲染结果进行合并，获得最终的渲染结果，具体为：每个独立进程基于其对应核组的计算资源进行每一部分渲染场景数据的渲染，各进程之间没有数据通信；当所有独立进程均完成渲染时，通过MPI通信将各个独立进程渲染场景的RGB数据进行合并，获得最终的渲染结果。3.如权利要求1所述的一种Blender渲染在神威超算中的并行优化方法，其特征在于，所述对所述渲染场景数据进行分割，具体为：按同一维度将渲染场景数据分割成匹配核组数量的若干部分。4.如权利要求1所述的一种Blender渲染在神威超算中的并行优化方法，其特征在于，所述针对Blender渲染计算过程中开启降噪功能的情况，采用添加数据重叠区的方式解决数据依赖问题，具体为：在渲染场景数据分割时，对于分割后的渲染场景数据，其首行和尾行多取一行相邻的数据。5.如权利要求1所述的一种Blender渲染在神威超算中的并行优化方法，其特征在于，对于每个独立进程，其仅在数据获取时多获取了冗余数据，在进行渲染...

【专利技术属性】
技术研发人员：陈彦言，徐希豪，张琳，
申请(专利权)人：济南超级计算中心有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人