用于运行高性能GPU应用的方法、装置及计算机存储介质制造方法及图纸

技术编号：26600851 阅读：40 留言：0更新日期：2020-12-04 21:24

本发明专利技术实施例属于GPU技术领域，公开了用于运行高性能GPU应用的方法、装置及计算机存储介质；该方法可以包括：基于高端GPU应用程序的渲染复杂度为待渲染帧划分至少一个宏分块；建立宏分块与GPU阵列中各GPU之间的映射关系；将所述待渲染帧的渲染任务划分为各宏分块对应的渲染子任务；根据所述映射关系将各宏分块对应的渲染子任务分配至各宏分块所映射的GPU以执行。通过上述方法能够将高端GPU应用部署至低端GPU执行，以实现通过低端GPU运行高端GPU应用的效果。

全部详细技术资料下载

【技术实现步骤摘要】
用于运行高性能GPU应用的方法、装置及计算机存储介质
本专利技术实施例涉及图像处理器（GPU，GraphicsProcessingUnit）
，尤其涉及用于运行高性能GPU应用的方法、装置及计算机存储介质。
技术介绍
随着GPU通用技术的发展，GPU所能适用的应用场景愈加丰富，通常可以将GPU应用程序依照其所适用的GPU的性能，划分为适用于低端GPU运行的低端GPU应用、适用于中、高端GPU运行的中、高端GPU应用。目前来说，依照GPU的每秒浮点运算次数（FLOPS，FLoating-pointOperationPerSecond）性能指标将GPU划分为低端GPU（低于192GFLOPS的GPU）、中端GPU（192G至1024GFLOPS的GPU）以及高端GPU（高于1024GFLOPS的GPU），可以理解地，高、中、低端GPU是相对而言的，上述指标阈值随着GPU的发展也会随之进行更新，本专利技术实施例不做具体限定。通常来说，高端GPU应用是指对性能需求较高的图形应用程序，这类应用程序对渲染需求非常高...

【技术保护点】
1.一种用于运行高性能GPU应用的方法，其特征在于，所述方法应用于CPU，所述方法包括：/n基于高端GPU应用程序的渲染复杂度为待渲染帧划分至少一个宏分块；/n建立宏分块与GPU阵列中各GPU之间的映射关系；/n将所述待渲染帧的渲染任务划分为各宏分块对应的渲染子任务；/n根据所述映射关系将各宏分块对应的渲染子任务分配至各宏分块所映射的GPU以执行。/n

【技术特征摘要】
1.一种用于运行高性能GPU应用的方法，其特征在于，所述方法应用于CPU，所述方法包括：
基于高端GPU应用程序的渲染复杂度为待渲染帧划分至少一个宏分块；
建立宏分块与GPU阵列中各GPU之间的映射关系；
将所述待渲染帧的渲染任务划分为各宏分块对应的渲染子任务；
根据所述映射关系将各宏分块对应的渲染子任务分配至各宏分块所映射的GPU以执行。

2.根据权利要求1所述的方法，其特征在于，所述将所述待渲染帧的渲染任务划分为各宏分块对应的渲染子任务，包括：
将所述渲染任务中属于同一宏分块的顶点划分为同属宏分块对应的渲染子任务。

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：
读取各GPU对应的显存中由各GPU执行完成对应的渲染子任务之后所写入的执行结果；
根据所述宏分块与GPU阵列中各GPU之间的映射关系，将所有GPU的执行结果进行整合，获得待渲染帧对应的渲染完成图像。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：
将各GPU执行各自渲染子任务以外所需的由其他GPU映射的宏分块中的顶点数据发送至相应的GPU。

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：
计算所述待渲染帧中各顶点的顶点平面坐标；
根据各顶点的顶点平面坐标完成所述待渲染帧的图元装配，并确定所述顶点所属的宏分块。

6.根据权利要求1所述的方法，其特征在于，所述方法还包括：
将待渲染帧的所有顶点平均分配至所述GPU阵列中各GPU，以使得各GPU完成各自所分配顶点的顶点着色操作以及平面坐标计算；
读取已完成顶点着色操作的顶点的平面坐标，并按照当前图元类型对所述顶点进行图元装配，并确定所述顶点所属的宏分块。

7.一种用于运行高...

【专利技术属性】
技术研发人员：黄虎才，李洋，姚冠宇，
申请(专利权)人：西安芯瞳半导体技术有限公司，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人