一种基于异构系统的处理性能优化方法及装置制造方法及图纸

技术编号:27132848 阅读:27 留言:0更新日期:2021-01-25 20:20
本申请提供一种基于异构系统的处理性能优化方法及装置。方法包括:获取异构系统的拓扑结构信息,拓扑结构信息包括CPU架构、GPU数量、CPU与GPU的连接方式和超线程状态;根据拓扑结构信息生成至少一种绑定策略,并利用绑定策略对异构系统中的存储器、CPU和GPU进行绑定,确定最优绑定策略;基于最优绑定策略调节性能参数,获得异构系统在各性能参数下对应的性能指标;从多个性能指标中确定最优性能指标,以实现对异构系统性能的优化。本申请通过根据所述拓扑结构信息生成多种绑定策略,并确定最优绑定策略,基于最优绑定策略调节各个性能参数,从而使得异构系统发挥出较佳的性能。从而使得异构系统发挥出较佳的性能。从而使得异构系统发挥出较佳的性能。

【技术实现步骤摘要】
一种基于异构系统的处理性能优化方法及装置


[0001]本申请涉及计算机
,具体而言,涉及一种基于异构系统的处理性能优化方法及装置。

技术介绍

[0002]随着高性能技术的发展,高性能计算机的应用越来越广泛。其中,有些应用受到访存、网络、算法实现方式等因素的影响,导致大规模的扩展计算机性能受到了限制,对单机的计算能力提出了更高的要求。例如单台计算能力更强的四路服务器、八路服务器等。
[0003]为了能够实现高资源利用率、减少空间占用、降低功耗等,通常采用更高密度的异构系统。异构计算通常指中央处理器(Central Processing Unit,CPU)+图形处理器(Graphics Processing Unit,GPU)、CPU+现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者CPU+其他加速设备协同计算。
[0004]为了能够对异构系统的优化,现有技术是根据经验人工对异构系统中的各个节点进行绑定,从而获取较优的绑定策略,并对矩阵大小,步长等参数进行调整,从而实现对异构系统的优化,通过人工对异构系统的各个节点绑定,使得优化效率较慢。

技术实现思路

[0005]本申请实施例的目的在于提供一种基于异构系统的处理性能优化方法及装置,用以提高对异构系统处理性能优化的效率。
[0006]第一方面,本申请实施例提供一种基于异构系统的处理性能优化方法,异构系统包括如下模块:存储器、CPU和GPU,所述方法包括:获取异构系统的拓扑结构信息,所述拓扑结构信息包括CPU架构、GPU数量、CPU与GPU的连接方式和超线程状态;根据所述拓扑结构信息生成至少一种绑定策略,并利用所述至少一种绑定策略对所述异构系统中的存储器、CPU和GPU进行绑定,确定最优绑定策略;基于所述最优绑定策略,调节性能参数,获得所述异构系统在各性能参数下对应的性能指标;从多个性能指标中确定最优性能指标,以实现对所述异构系统处理性能的优化。
[0007]本申请实施例通过根据所述拓扑结构信息生成多种绑定策略,并利用多种绑定策略对异构系统中的存储器、CPU和GPU进行绑定,确定最优绑定策略,并基于最优绑定策略调节各个参数,从而能够使得异构系统发挥出较佳的性能。
[0008]进一步地,在获取异构系统的拓扑结构信息之前,所述方法还包括:验证所述异构系统的状态性能是否满足预设要求,其中,在所述状态性能满足预设要求的情况下,执行所述获取异构系统的拓扑结构的步骤;所述状态性能包括:GPU双精度矩阵乘法Dgemm性能、GPU双精度三角矩阵求解Trsm性能、高速串行计算机扩展总线标准一维/二维拷贝PCIE 1D/2D Copy性能、节点内进程间通信性能和显存带宽性能中的至少一种。
[0009]本申请实施例通过在对异构系统进行优化之前,对异构系统的状态性能进行测试,从而保证异构系统能够在状态性能正常的情况下进行处理性能的优化。
[0010]进一步地,所述对所述异构系统的状态性能进行验证,包括:确定每一状态性能对应的数据尺寸和通信模式;其中,所述数据尺寸为状态性能验证时求解的矩阵大小;分别利用确定的数据尺寸和通信模式对对应的状态性能进行验证。
[0011]本申请实施例中,由于对不同类型的状态性能进行测试所需的数据尺寸和通信模式不同,因此,需要利用不同的数据尺寸和通信模式对对应的状态性能进行测试,从而保证异构系统的状态性能处于正常状态。
[0012]进一步地,所述根据所述拓扑结构信息生成至少一种绑定策略,并利用所述至少一种绑定策略对所述异构系统中的存储器、CPU和GPU进行绑定,确定最优绑定策略,包括:根据所述拓扑结构和预先设定的绑定范围,按照排列组合的方式对所述异构系统中的存储器、CPU和GPU进行绑定,获得多种绑定策略;其中,所述绑定范围用于表征所述异构系统中可进行绑定的模块的组合;对每种绑定策略对应的异构系统进行性能测试,根据性能测试结果确定最优绑定策略。
[0013]本申请实施例通过拓扑结构和预先设定的绑定范围自动生成异构系统的绑定策略,不需要人工手动绑定,从而能够更快速的确定最优绑定策略,提高了对异构系统优化的效率。
[0014]进一步地,在获得多种绑定策略之后,所述方法还包括:接收针对所述绑定策略的优化策略;根据所述优化策略对所述绑定策略进行优化。本申请实施例通过在自动生成绑定策略后,提供手动调优的接口,从而能够更加快速的确定最优绑定策略,提高了对异构系统优化的效率。
[0015]进一步地,所述基于所述最优绑定策略,调节性能参数,获得所述异构系统在各性能参数下对应的性能指标,包括:获取各个性能参数的阈值及对应的调整步长;根据各个性能参数的阈值及对应的调整步长对对应的性能参数取值进行调整,获得调整后的多组性能参数;分别利用每组性能参数对所述异构系统进行高性能线性系统软件包HPL基准测试,获得对应的性能指标。
[0016]本申请实施例基于最优绑定策略,利用各个性能参数对应的阈值和调整步长,对对应的性能参数进行调节,以获得HPL基准测试下的性能指标,选择性能指标最优的一组参数对异构系统进行配置,实现对异构系统的处理性能的优化。
[0017]进一步地,所述性能参数包括:矩阵大小、处理步长、矩阵的子块大小和结束递归操作时对应的子块大小。本申请实施例通过对矩阵大小、处理步长、子块大小和结束递归操作时对应的子块大小进行调节,使得异构系统达到最佳运行性能和效率。
[0018]第二方面,本申请实施例提供一种基于异构系统的处理性能优化装置,异构系统包括存储器、中央处理器CPU和图形处理器GPU,所述装置包括:结构获取模块,用于获取异构系统的拓扑结构信息,所述拓扑结构信息包括CPU架构、GPU数量、CPU与GPU的连接方式和超线程状态;绑定模块,用于根据所述拓扑结构信息生成至少一种绑定策略,并利用所述至少一种绑定策略对所述异构系统中的存储器、CPU和GPU进行绑定,确定最优绑定策略;调参模块,用于基于所述最优绑定策略,调节性能参数,获得所述异构系统在各性能参数下对应的性能指标;优化模块,用于从多个性能指标中确定最优性能指标,以实现对所述异构系统处理性能的优化。
[0019]第三方面,本申请实施例提供一种电子设备,包括:处理器、存储器和总线,其中,
所述处理器和所述存储器通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行第一方面的方法。
[0020]第四方面,本申请实施例提供一种非暂态计算机可读存储介质,包括:所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行第一方面的方法。
[0021]本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
[0022]为了更清本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于异构系统的处理性能优化方法,其特征在于,异构系统包括如下模块:存储器、中央处理器CPU和图形处理器GPU,所述方法包括:获取异构系统的拓扑结构信息,所述拓扑结构信息包括CPU架构、GPU数量、CPU与GPU的连接方式和超线程状态;根据所述拓扑结构信息生成至少一种绑定策略,并利用所述至少一种绑定策略对所述异构系统中的存储器、CPU和GPU进行绑定,确定最优绑定策略;基于所述最优绑定策略,调节性能参数,获得所述异构系统在各性能参数下对应的性能指标;从多个性能指标中确定最优性能指标,以实现对所述异构系统处理性能的优化。2.根据权利要求1所述的方法,其特征在于,在获取异构系统的拓扑结构信息之前,所述方法还包括:验证所述异构系统的状态性能是否满足预设要求,其中,在所述状态性能满足预设要求的情况下,执行所述获取异构系统的拓扑结构的步骤;所述状态性能包括:GPU双精度矩阵乘法Dgemm性能、GPU双精度三角矩阵求解Trsm性能、高速串行计算机扩展总线标准一维/二维拷贝PCIE 1D/2D Copy性能、节点内进程间通信性能和显存带宽性能中的至少一种。3.根据权利要求2所述的方法,其特征在于,所述对所述异构系统的状态性能进行验证,包括:确定每一状态性能对应的数据尺寸和通信模式;其中,所述数据尺寸为状态性能验证时求解的矩阵大小;分别利用确定的数据尺寸和通信模式对对应的状态性能进行验证。4.根据权利要求1所述的方法,其特征在于,所述根据所述拓扑结构信息生成至少一种绑定策略,并利用所述至少一种绑定策略对所述异构系统中的存储器、CPU和GPU进行绑定,确定最优绑定策略,包括:根据所述拓扑结构和预先设定的绑定范围,按照排列组合的方式对所述异构系统中的存储器、CPU和GPU进行绑定,获得多种绑定策略;其中,所述绑定范围用于表征所述异构系统中可进行绑定的模块的组合;对每种绑定策略对应的异构系统进行性能测试,根据性能测试结果确定最优绑定策略。5.根...

【专利技术属性】
技术研发人员:胡辰
申请(专利权)人:曙光信息产业北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利