一种异构硬件环境下的粗粒度计算加速比评估方法与系统技术方案

技术编号：28558423 阅读：38 留言：0更新日期：2021-05-25 17:52

一种异构硬件环境下的粗粒度计算加速比评估方法与系统，在实际计算执行前能够评估出是否由加速的结果，避免了每次先计算再度量的开销，能够根据计算上下文，实时地自动化地评估出加速比，相对于经验、度量的方式，更为准确，也较为高效，实现计算的动态调度，将有加速比的模块运行在GPU上，没有加速比的模块依然运行在CPU上，能够最大化地利用异构硬件的计算能力，使系统实现最佳性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种异构硬件环境下的粗粒度计算加速比评估方法与系统
本专利技术属于高性能领域，涉及一种异构硬件计算环境下的计算加速比的评估方法，更具体涉及CPU、GPU混合计算场景下，同样代码在CPU、GPU硬件下计算加速比的快速评估方法。
技术介绍
随着高性能计算技术的发展，计算设备除了CPU外，还出现了越来越多的协处理器，诸如GPU、FPGA、嵌入式加速卡等，这些协处理器可以对传统的基于CPU计算的程序进行加速，提高业务系统整体的计算性能。在高性能并行计算领域，并非把CPU代码重写为比如GPU代码就可以实现计算加速，一个在CPU上运行的多线程的程序改为在GPU上运行的并行程序，经常，因为受数据拷贝的开销增加、GPU计算调度机制等因素的影响，运行速度反而下降了。现有的计算性能的预估方式主要凭人工经验及代码迁移后的实际测试结果度量，如果能够提前预估程序迁移的计算效果，那么无疑可以减少很多不必要的工作开销。
技术实现思路
针对上述情况，本专利技术创新地提出一种粗粒度的计算加速比的评估方法，该方法可以很好的解决上述问题。系统能够根据此方法迅速判断某模块由CPU迁移到GPU上计算是否有加速比，加速比大概是多少。本专利技术公开的一种异构硬件环境下的粗粒度计算加速比评估方法与系统，区别于现有的计算加速比评估方法其可以通过算法快速地自动化地估算加速效果，通过量化的加速比结果，可以更高效地调度计算，是一种计算效果评估实现手段。本专利技术的、步骤如下：步骤1.获取异构硬件的基础属性及计算模块的计算类别。<...

【技术保护点】
1.一种异构硬件环境下的粗粒度计算加速比评估方法与系统，其特征在于：步骤如下：/n步骤1.获取异构硬件的基础属性及计算模块的计算类别；/n步骤2.根据计算模块的计算类别：数据量与计算量成线性关系或指数关系，根据计算类别选择不同的线性评估算法或指数评估算法结合计算上下文具体参数对计算模块的加速比进行预估；/n此步骤中加速比计算方法为：加速比N＝算法在CPU计算耗时T(cpu)/算法在GPU计算耗时T(GPU)，其中T(GPU)＝数据IO总量S(inData+outData)/总线IO速度Speed(PCIE)+T(CPU)/并行度M；线性评估算法及指数评估算法的差异主要体现在计算量与数据量之间的关系上；比如在线性关系下，在CPU上100M数据的计算时长T(CPU)＝t秒，则指数关系(一般为平方关系)下，在CPU上100M数据的计算时长为T(CPU)＝t*t秒；/n步骤3.根据加速比结果，如果加速比>1，则表明计算由CPU迁移至GPU有加速效果，则可将计算由CPU迁移至GPU；如果加速比<＝1,则表明计算由CPU迁移至GPU没有加速效果。/n

【技术特征摘要】
1.一种异构硬件环境下的粗粒度计算加速比评估方法与系统，其特征在于：步骤如下：
步骤1.获取异构硬件的基础属性及计算模块的计算类别；
步骤2.根据计算模块的计算类别：数据量与计算量成线性关系或指数关系，根据计算类别选择不同的线性评估算法或指数评估算法结合计算上下文具体参数对计算模块的加速比进行预估；
此步骤中加速比计算方法为：加速比N＝算法在CPU计算耗时T(cpu)/算法在GPU计算耗时T(GPU)，其中T(GPU)＝数据IO总量S(inData+outData)...

【专利技术属性】
技术研发人员：汤文莉，
申请(专利权)人：南京工业职业技术学院，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人