一种基于机器学习的多核下MPI最优运行时的参数预测方法技术

技术编号:7844132 阅读:350 留言:0更新日期:2012-10-13 02:24
本发明专利技术提出了一种在多核环境下优化MPI应用的新方法:运用机器学习方法对多核机群下MPI应用的最优运行时参数进行预测。我们设计了具有不同点到点通信与集合通信数据比例的训练基准在特定的多核机群下产生训练数据,同时采用能快速输出结果的决策树REPTree和产生多个输出并具有较好抗噪性的神经网络ANN来构建运行时参数优化模型,通过训练基准产生的训练数据对优化模型进行训练,训练后的模型被用来对未知的输入MPI程序的最优运行时参数进行预测。实验证明,基于REPTree的预测模型和基于ANN的预测模型得到的优化运行时参数产生的加速比平均达到实际最大加速比的90%以上。

【技术实现步骤摘要】

本专利技术涉及多核环境下MPI优化,具体来说,涉及一种基于机器学习的多核下MPI最优运行时的参数预测方法
技术介绍
随着多核技术更加广泛的应用于机群,多核机群下MPI应用的性能优化成为了研究的热点。目前主流的MPI库实现(Open MPI、MPICH等)都提供了可调的运行时参数机制,允许用户根据特定的应用需求、硬件以及操作系统来调优运行时参数以提升MPI应用的性倉泛。 本章我们设计实现了一种基于机器学习的通用的多核环境下MPI运行时参数优化模型,能自动为给定软、硬件结构的多核机群下的MPI程序预测接近最优的运行时参数组合。我们提出的预测模型基于机器学习中的决策树和人工神经网络方法,通过对预测模型的离线训练和在线学习,能自动为未知的MPI程序预测接近最优的运行时参数。要预测的MPI程序由对源码运行一次得到的动态特征和通信器大小等静态特征来共同描述。我们提出的基于机器学习的最优MPI运行时参数预测方法在基于InfiniBand的多核SMP机群上进行验证,并运用Open MPI这一主流的MPI库作为预测MPI最优运行时参数的环境。通过NAS并行基准套件2. 4中的IS和LU基准的实验证本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的多核下MPI最优运行时的参数预测方法,其特征在于 采用决策树和人工神经网络两种标准构建优化模型; 用构造的训练基准在目标多核机群上通过设置多组运行时的参数的组合生成训练数据,并对构造的模型进行离线训练; 训练后的模型用于对新的MPI程序预测最优的运行时的配置参数; 将预测所得结果与实际最有运行时参数向量做对比,评估预测模式的准确度。2.如权利要求I所述的方法,其特征在于所述决策树模型将训练基准的程序特征和运行时参数的配置组合作为决策树模型的输入,训练数据为{Fi,CJ,其中Fi为训练基准的程序特性,Ci为当前程序特征下的运行时参数组合,实际得到的加速比作为决策树的输出。3.如权利要求I所述的方法,其特征在于所述人工神经网络模型将训练基准中产生最高加速比的数据选出用来训练参数预测模型,训练数据为{Fi,Ci best},其中Fi = <f:,f2,. . .,fffl>为训练基准的程序特性,Ci best = <Cl, c2, , cn>为当前程序特征下的最佳运行时参数组合。4.如权利要求2所述的方法,其特征在于所述决策树模型在训练模型阶段,通过变换向量F与C产生不同的加速比结果;运用模型进行预测时,若Fp代表输入的MPI程序的程序特征向量,则能得到最大加速比Smax的运行时参数配置Cbest将是此MPI程序的最佳运行时参数组合向量,即 Smax — MEEPTree (Fp,Cbest)。5.如权利要求3所述的方法,其特征...

【专利技术属性】
技术研发人员:曾宇
申请(专利权)人:北京市计算中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1