【技术实现步骤摘要】
一种适合复杂异构系统的HPL矩阵更新优化方法
本专利技术涉及计算机高性能计算领域,特别提出了一种适合复杂异构系统的HPL(HighPerformanceLinpack)矩阵更新优化方法,该优化方法不仅优化定制了HPL的行交换流程,而且优化了具体的行交换算法,充分做到GPU计算与行交换的并行计算,隐藏行交换执行时间,从而提高整个系统的HPL效率。
技术介绍
随着信息化社会的不断变化,高性能计算领域发生了巨大的变化,在人工智能、气象环境、航空航天、生物信息、基因测序、石油勘探、工业设计等各个领域发挥了重要作用,解决了一些重大科学和工程问题。高性能计算是前沿性的高技术,是各国争夺的战略制高点,是衡量国家科技能力的重要标志。LinpackBenchmark是国际上广泛用于测试高性能计算机系统性能的程序,而HPL是LinpackBenchmark在分布存储计算机上的并行版本,是业内公认的高性能计算运算能力基准测试方法,其报告的每秒浮点运算次数,是著名的全球超级计算机TOP500的排名依据。HPL是分布式并行方法,使用超 ...
【技术保护点】
1.一种适合复杂异构系统的HPL矩阵更新优化方法,其特征在于,对HPL矩阵更新的行交换进行优化:在执行HPL的第一分段行交换完成、上一次循环矩阵更新和当前进程接收到下一次循环的行交换信息之后,执行第一分段的下一次循环的行交换。/n
【技术特征摘要】
1.一种适合复杂异构系统的HPL矩阵更新优化方法,其特征在于,对HPL矩阵更新的行交换进行优化:在执行HPL的第一分段行交换完成、上一次循环矩阵更新和当前进程接收到下一次循环的行交换信息之后,执行第一分段的下一次循环的行交换。
2.如权利要求1所述的方法,其特征在于,行交换分段过程中选择倍数递增,即第i+1段列数是第i段列数的倍数。
3.如权利要求2所述的方法,其特征在于,对HPL矩阵更新中的Long行交换通信方法进行优化,其包括spread过程和roll过程;将spread过程的接收缓冲与roll过程的发送缓冲分离,当前行进程在执行roll过程之前,将本地需要交换的数据拷贝到roll过程的发送缓冲区;在roll过程执行网络传输的同时,当前行...
【专利技术属性】
技术研发人员:黎雷生,马文静,赵海涛,孙家昶,李会元,
申请(专利权)人:中国科学院软件研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。