一种数值水池应用特征性能采集和监控系统及其运行方法技术方案

技术编号:23763984 阅读:29 留言:0更新日期:2020-04-11 18:52
本发明专利技术公开了一种数值水池应用特征性能采集和监控系统及其运行方法。所述系统包括数值水池应用特征性能采集和监控系统(100)、应用性能基准线管理模块(101)和应用性能分析报告模块(102),所述应用性能基准线管理模块(101)和应用性能分析报告模块(102)均将信号传输至数值水池应用特征性能采集和监控系统(100)。本发明专利技术统计除监测每次虚拟试验的性能数据之外,同时采集每个作业的执行次数和累计耗费时间,它主要反映的是不同过程运行的时间、各种不同类型的通信花费的时间及执行次数和各处理器节点运行的时间等。

A characteristic performance acquisition and monitoring system for numerical water tank and its operation method

【技术实现步骤摘要】
一种数值水池应用特征性能采集和监控系统及其运行方法
本专利技术属于并行程序信息采集
;具体涉及一种数值水池应用特征性能采集和监控系统及其运行方法。
技术介绍
数值水池的基础理论是计算流体力学(CFD)理论,现代计算流体力学所解决的问题越来越复杂,对于计算能力的要求与日俱增,随着计算节点及核数的增加,管理开销、通信开销增加,存储访问争用严重,并行效率下降,并行计算常见的存储墙、并行编程墙,通信墙问题凸现。因此,监测并完善通信效率、通信次数、内存使用率、I/O等和影响性能的指标具有重要的意义。基于集群的计算是并行计算发展的一种必然趋势,它能有效地凝聚计算资源,形成协同的高性能计算能力,并具有良好的可伸缩性。在集群计算模式下,并行作业的性能监测分析是提高计算效能的一个重要手段,也是并行计算中的一个研究难点,它能够监测复杂并行作业的执行过程,揭示并行作业的执行行为,分析影响执行效率的因素和瓶颈,为改进和优化并行作业提供依据。现有的并行程序性能分析工具,若按工作方式来分类可以分为监测型和预测型两类。监测型工具通过在程序实际运行时收集本文档来自技高网...

【技术保护点】
1.一种数值水池应用特征性能采集和监控系统,其特征在于,所述系统包括数值水池应用特征性能采集和监控系统(100)、应用性能基准线管理模块(101)和应用性能分析报告模块(102),所述应用性能基准线管理模块(101)和应用性能分析报告模块(102)均将信号传输至数值水池应用特征性能采集和监控系统(100);/n所述应用性能基准线管理模块(101)包括管理员设置性能基准线模块(110)、估算作业运行时长模块(111)和作业运行状况分析模块(112),所述作业运行状况分析模块(112)将信号传输至管理员设置性能基准线模块(110),所述管理员设置性能基准线模块(110)将信号传输至估算作业运行时长...

【技术特征摘要】
1.一种数值水池应用特征性能采集和监控系统,其特征在于,所述系统包括数值水池应用特征性能采集和监控系统(100)、应用性能基准线管理模块(101)和应用性能分析报告模块(102),所述应用性能基准线管理模块(101)和应用性能分析报告模块(102)均将信号传输至数值水池应用特征性能采集和监控系统(100);
所述应用性能基准线管理模块(101)包括管理员设置性能基准线模块(110)、估算作业运行时长模块(111)和作业运行状况分析模块(112),所述作业运行状况分析模块(112)将信号传输至管理员设置性能基准线模块(110),所述管理员设置性能基准线模块(110)将信号传输至估算作业运行时长模块(111);
所述应用性能分析报告模块(102)包括应用性能统计CPU利用率模块(113)、应用性能统计GPU利用率模块(114)、应用性能统计MEM利用率模块(115)、应用性能统计SWAP利用率模块(116)、应用性能统计网络收发速率模块(117)、应用性能统计磁盘读写速率模块(118)及基准线曲线对比图模块(119);
应用性能统计CPU利用率模块(113)为为监测应用在CPU计算资源上的利用率,应用性能统计GPU利用率模块(114)为监测应用在GPU计算资源上的利用率,应用性能统计MEM利用率模块(115)为监测用户提交并行程序时,使用内存空间的合理性,应用性能统计SWAP利用率模块(116)为用户展示当前或历史作业的指定时间内该版本应用Swap的平均值,最大值,最小值,以确保虚拟内存的使用频率,应用性能统计网络收发速率模块(117),应用性能统计磁盘读写速率模块(118)展示当前或历史作业的指定时间内该版本应用磁盘读/写速率的平均值,最大值,最小值,基准线曲线对比图模块(119)方便用户针对8项信息对程序进行有目的修改。


2.利用权利要求1所述数值水池应用特征性能采集和监控系统的运行方法,其特征在于,所述运行方法包括作业提交步骤、作业基本信息和状态获取步骤,利用所述管理员设置性能基准线模块(110)的作业提交步骤具体为:
步骤110.1:从前端页面获取参数后,首先判断是否所有必填项都已填写完毕;
步骤110.2:如果参数全部填写完整,则分别判断提交作业所必须的三个shell脚本都已正确编写:app.sh、en.sh和submit.sh;
步骤110.3:当步骤110.2已满足要求,则解析调度系统参数,所有模板参数以“--”开头,其中job-name为作业名称,用于后续作业目录名的生成;
步骤110.4:获取作业目录:在submit.sh中,当调度系统参数中存在workdir时,其值即为作业目录的根目录;否则获取用户home目录为作业目录;
步骤110.5:所有参数设置完毕后,会执行submit.sh脚本,为启动作业调度系统PBS做脚本预处理执行准备;
步骤110.6:PBS作业调度系统相关参数解析完毕之后,满足提交作业基本条件;
步骤110.7:执行qsub指令,将作业分配到作业调度系统当中执行;
步骤110.8:建立数据库的t_job表,并将作业id,作业名称,作业目录,应用参数,调度系统参数写入t_job表中;
步骤1...

【专利技术属性】
技术研发人员:王宇华夏桂华韩启龙刘成刚周连科张泽宝
申请(专利权)人:哈尔滨工程大学
类型:发明
国别省市:黑龙;23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1