一种多结点MIC卡检测方法及系统技术方案

技术编号:9906898 阅读:166 留言:0更新日期:2014-04-11 05:47
本发明专利技术提供一种多结点MIC卡检测方法及系统,应用于Linux集群管理领域:上述方法包括以下步骤:获取/etc/hosts下各结点IP地址并根据获取的所述各结点IP地址以ssh方式访问各结点;对可连通结点上MIC卡状况进行检测并根据检测结果,进行变量标识并用相应颜色显示;通过实施本发明专利技术的技术方案,通过多结点MIC卡检测脚本工具实现多个结点上MIC卡是否正常工作的自动化检测,并通过不同的颜色来提醒操作者各结点的状态,减少手动检测的步骤和工作量。

【技术实现步骤摘要】
【专利摘要】本专利技术提供一种多结点MIC卡检测方法及系统,应用于Linux集群管理领域:上述方法包括以下步骤:获取/etc/hosts下各结点IP地址并根据获取的所述各结点IP地址以ssh方式访问各结点;对可连通结点上MIC卡状况进行检测并根据检测结果,进行变量标识并用相应颜色显示;通过实施本专利技术的技术方案,通过多结点MIC卡检测脚本工具实现多个结点上MIC卡是否正常工作的自动化检测,并通过不同的颜色来提醒操作者各结点的状态,减少手动检测的步骤和工作量。【专利说明】一种多结点MIC卡检测方法及系统
本专利技术涉及Linux集群管理领域,尤其涉及一种多结点MIC卡检测方法及系统。
技术介绍
随着集群以及超级计算机计算能力的快速提高以及广泛应用,可以预见采用加速部件(如MIC卡)进行并行计算加速的情形会越来越多;加速部件可以提供几十甚至成百上千的并行进程,并行进程中的资源竞争是显而易见的,这也使得在使用加速部件时,内存溢出以及其他异常现象会使得加速部件工作不正常。目前,检测多结点MIC卡,需要手动去登录每一个结点并验证MIC是否工作正常,如果对于上百或上千结点的MIC卡进行检测,将要手动进行登录结点以及MIC基本信息查询及查看等大量操作,此时手动输入将会增加人为因素出错几率,所以对各结点上的加速部件是否正常工作的自动检测,是当前亟待解决的问题。
技术实现思路
本专利技术提供一种多结点MIC卡检测方法及系统,以解决上述问题。本专利技术提供一种多结点MIC卡检测方法。上述方法包括以下步骤:获取/etc/hosts下各结点IP地址并根据获取的所述各结点IP地址以ssh方式访问各结点;对可连通结点上MIC卡状况进行检测并根据检测结果,进行变量标识并用相应颜色显示。本专利技术还提供一种多结点MIC卡检测系统,包括:获取模块、访问模块、检测模块、反馈模块;所述获取模块通过所述访问模块与检测模块相连;所述检测模块与所述反馈模块相连;所述获取模块,用于获取/etc/hosts下各结点IP地址并将获取的各结点IP地址输出给所述访问模块;所述访问模块,用于根据获取的所述各结点IP地址以SSh方式访问各结点;所述检测模块,用于对可连通结点上MIC卡状况进行检测并将检测结果输出给所述反馈模块;所述反馈模块,用于根据检测结果,进行变量标识并用相应颜色显示。通过实施本专利技术的技术方案,通过多结点MIC卡检测脚本工具实现多个结点上MIC卡是否正常工作的自动化检测,并通过不同的颜色来提醒操作者各结点的状态,减少手动检测的步骤和工作量。【专利附图】【附图说明】此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1所示为本专利技术的实施例1的多结点MIC卡检测方法流程图;图2所示为本专利技术的实施例2的多结点MIC卡检测系统结构图。【具体实施方式】下文中将参考附图并结合实施例来详细说明本专利技术。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。本专利技术提供一种多结点MIC卡检测方法,其特征在于,包括以下步骤:获取/etc/hosts下各结点IP地址并根据获取的所述各结点IP地址以ssh方式访问各结点;对可连通结点上MIC卡状况进行检测并根据检测结果,进行变量标识并用相应颜色显示。其中,获取/etc/hosts下各结点IP地址的过程为:通过脚本读入Linux系统/etc/hosts文件获得各结点IP地址。其中,将获得的各结点IP地址传入变量中。其中,根据获取的所述各结点IP地址以ssh方式访问各结点的过程包括:各结点ssh检测及ssh登陆。其中,各结点ssh检测及ssh登陆是指:依据获得的所述各节点IP地址,进行ssh连通性检测,并登陆到可连通结点。其中,依据获得的所述各节点IP地址,进行ssh连通性检测,并登陆到可连通结点的过程为:对包含IP地址的变量,使用SSh命令连接相应IP地址,并获得执行SSh命令的返回值,如返回值正常则ssh可连通,如返回至异常则ssh无法连通,对于可连通的IP地址进行ssh登陆。其中,对可连通结点上MIC卡状况进行检测的过程为:登陆到可连通结点并检测所述可连通结点上MIC卡是否正常工作。其中,登陆到可连通结点并检测所述可连通结点上MIC卡是否正常工作的过程为:执行Linux系统命令Ispci查询pci总线相关信息,将查询获得的pci总线相关信息进行筛选,如果有MIC卡的相关信息,说明系统正常识别MIC卡;若正常识别MIC卡,则执行MIC卡驱动自带命令micinfo,将查询获得的MIC卡相关信息进行筛选,如果有异常信息,说明MIC卡工作异常。其中,根据检测结果,进行变量标识并用相应颜色显示的过程为:若MIC卡识别异常或MIC卡相关信息异常,则标识该结点的相应变量,并以红色字体闪烁显示该结点及MIC编号;若MIC卡识别正常并且MIC卡相关信息正常,则标识该结点的相应变量,并以绿色字体显示该结点及MIC编号。本专利技术通过脚本工具来达到简化操作的目的,适用于多结点MIC卡检测脚本工具主要分为:获取/etc/hosts下各结点IP地址;各结点ssh检测及ssh登陆;各结点MIC状况检测;各结点MIC状况变量标识并用相应颜色显示。其中:获取/etc/hosts下各结点IP地址是通过脚本读入Linux系统/etc/hosts文件获得各结点IP地址;将获得的各结点IP地址传入变量中。 其中,各结点ssh检测及ssh登陆是依据所获得的IP地址,进行ssh连通性检测,并登陆到可连通结点;各结点SSh检测及SSh登陆是依据所获得的IP地址,进行SSh连通性检测,并登陆到可连通结点的具体过程为:对包含IP地址的变量,使用ssh命令连接相应IP地址,并获得执行ssh命令的返回值,如返回值正常则ssh可连通,如返回至异常则ssh无法连通,对于可连通的IP地址进行SSh登陆。其中,各结点MIC状况检测是指:登陆到可连通结点并检测所述可连通结点上MIC卡是否正常工作;登陆到可连通结点并检测所述可连通结点上MIC卡是否正常工作的具体过程为:执行Linux系统命令Ispci查询pci总线相关信息,将查询获得的pci总线相关信息进行筛选,如果有MIC卡的相关信息,说明系统正常识别MIC卡;若正常识别MIC卡,则执行MIC卡驱动自带命令micinfo,将查询获得的MIC卡相关信息进行筛选,如果有异常信息,说明MIC卡工作异常。各结点MIC状况变量标识并用相应颜色显示是指:依据MIC卡是否正常工作来标识变量,并用相应的颜色进行显示;其中,各结点MIC状况变量标识并用相应颜色显示是指:依据MIC卡是否正常工作来标识变量,并用相应的颜色进行显示的具体过程为:若MIC卡识别异常或MIC卡相关信息异常,则标识该结点的相应变量,并以红色字体闪烁显示该结点及MIC编号;若MIC卡识别正常并且MIC卡相关信息正常,则标识该结点的相应变量,并以绿色字体显示该结点及MIC编号。图1所示为本专利技术的实施例1的多结点MIC卡检测方法流程图,包括以下步骤:步骤101:获取/etc/hosts下各结点IP地址并根据获取的所述各结点IP地址以ssh方式访问各结点;步骤10本文档来自技高网...

【技术保护点】
一种多结点MIC卡检测方法,其特征在于,包括以下步骤:获取/etc/hosts下各结点IP地址并根据获取的所述各结点IP地址以ssh方式访问各结点;对可连通结点上MIC卡状况进行检测并根据检测结果,进行变量标识并用相应颜色显示。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈博文
申请(专利权)人:浪潮北京电子信息产业有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1