一种大规模并行程序性能预测实现方法技术

技术编号：3856067 阅读：218 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种基于有代表性重放的大规模并行程序性能预测实现方法，该方法属于并行程序性能预测的技术领域，包括步骤：收集并行程序的通信序列和计算向量，分析各个进程计算的相似性并选取有代表性的进程，记录有代表性进程的通信内容，使用目标平台的一个计算节点重放有代表性进程，获取有代表性进程的顺序计算时间，用这些计算时间代替其它进程的计算时间；获取并行程序的通信记录；使用网络模拟器自动预测最终的程序性能。通过本发明专利技术能够使用很少的硬件资源，得到精确的并行程序预测性能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及并行程序性能预测的

技术介绍
当前，大规模并行计算机包括成千上万个计算节点，在研制过程中，一般花费几年的开发时间和很高的人力和财力。对于这些计算机的设计人员，在设计阶段能够预测某个应用在未来设计系统上的性能对于提前发现系统瓶颈并改进系统设计具有重要意义。精确的预测某个应用在未来系统上的性能不但可以辅助设计未来计算机，还可以帮助应用人员开发者在未来系统可用前，提前发现应用程序的瓶颈，从而优化并改进程序性能。然而，精确的预测并行程序在未来系统上的性能是一件非常复杂的问题。因为，并行程序的执行时间由程序中的顺序计算时间、通信时间、以及它们之间的巻积三个因素决定。当前存在的网络模拟器能够很好模拟并行程序的通信时间，例如DIMEMAS和BigNetSim模拟器。然而，当前的方法不能获得精确的并行程序中的计算时间。当前国际上主要有三类方法用于估计程序中的顺序计算时间1、分析建模对并行程序中的顺序计算单元进行分析建模，得到计算单元的时间。美国圣地亚哥超级计算中心的Snavdy等人(A. Snavely et al. A framework for application performance modeling and prediction. In SC，02， pages 1-17， 2002.)通过插装和硬件计数器等技术收集程序的浮点、整数指令个数、访存模式等信息，以及目标系统的机器特征，从而构建一个参数化模型来估计程序的顺序计算时间。但是，随着体系结构和软件设计的复杂化，分析方法越来越难获得精确的计算时间。...

【技术保护点】
一种大规模并行程序性能预测实现方法，其特征在于，包括步骤：　Ｓ１：在主平台上收集并行程序中通信序列和计算向量；　Ｓ２：分析并行程序各进程的计算相似性，且从中选出有代表性的进程；　Ｓ３：在主平台上执行并行程序，记录步骤Ｓ２中选取的有代表性进程的每次通信内容；　Ｓ４：在目标平台的一个节点上重放步骤Ｓ２得到的有代表性进程，得到这些进程在目标平台上的顺序计算向量；　Ｓ５：使用通信插装工具获得并行程序的通信记录；　Ｓ６：将步骤Ｓ４得到的有代表性进程的顺序计算向量和步骤Ｓ５得到的通信记录，输入网络模拟器，该模拟器输出并行程序的预测时间。

【技术特征摘要】

【专利技术属性】
技术研发人员：郑纬民，陈文光，翟季冬，
申请(专利权)人：清华大学，
类型：发明
国别省市：11[]

全部详细技术资料下载我是这个专利的主人