虚拟云桌面故障检测方法、装置、设备及可读存储介质制造方法及图纸

技术编号:39290938 阅读:17 留言:0更新日期:2023-11-07 10:59
本发明专利技术提供一种虚拟云桌面故障检测方法、装置、设备及可读存储介质。该方法包括:当自动检测程序被触发后,检测硬件是否存在异常;当硬件不存在异常或异常被修复时,检测系统是否存在异常;当系统不存在异常或异常被修复时,检测基础服务是否存在异常;当基础服务不存在异常或异常被修复时,检测资源占用是否存在异常;当资源占用不存在异常或异常被修复时,检测配置是否存在异常;当配置不存在异常或异常被修复时,检测平台中基础部件的运行是否存在异常;当基础部件的运行不存在异常或异常被修复时,存储所有异常以及每个异常对应的修复策略。通过本发明专利技术,解决了现有技术中虚拟云桌面的故障点难以排查,虚拟云桌面的修复效率较低的问题。的问题。的问题。

【技术实现步骤摘要】
虚拟云桌面故障检测方法、装置、设备及可读存储介质


[0001]本专利技术涉及云计算和虚拟化
,尤其涉及一种虚拟云桌面故障检测方法、装置、设备及可读存储介质。

技术介绍

[0002]在私有云场景中,虚拟云桌面应用是主要的应用服务,相对于传统的桌面办公,虚拟云桌面更加灵活,资源利用率更高,运维成本更低。因此,虚拟云桌面涉及众多组件和服务,相应的,虚拟云桌面也必然会出现各种异常或故障,而各种异常或故障运维人员需要先在庞大的私有云环境中精准地检测到故障点,才能恢复虚拟云桌面的正常运行,导致虚拟云桌面的修复效率较低。

技术实现思路

[0003]本专利技术的主要目的在于提供一种虚拟云桌面故障检测方法、装置、设备及可读存储介质,旨在解决虚拟云桌面的故障点难以排查,虚拟云桌面的修复效率较低的问题。
[0004]第一方面,本专利技术提供一种虚拟云桌面故障检测方法,所述虚拟云桌面故障检测方法包括:
[0005]当自动检测程序被触发后,通过dmesg日志文件、lscpu命令的输出以及操作系统/proc/cpuinfo的输出检测硬件是否存在异常;
[0006]当硬件不存在异常或硬件异常被修复时,通过dmesg日志文件、目录或文件权限、/etc/group文件以及ls命令检测系统是否存在异常;
[0007]当系统不存在异常或系统异常被修复时,通过systemctl命令检测基础服务是否存在异常;
[0008]当基础服务不存在异常或基础服务异常被修复时,通过top命令的输出以及free

h命令的输出检测资源占用是否存在异常;
[0009]当资源占用不存在异常或资源占用异常被修复时,通过nova模块、cinder模块、numactl命令的输出、配置文件/etc/my.cnf以及数据库检测配置是否存在异常;
[0010]当配置不存在异常或配置异常被修复时,通过产品接口、nova命令的输出、find命令、数据库以及ps命令的输出检测平台中基础部件的运行是否存在异常;
[0011]当平台中基础部件的运行不存在异常或基础部件的运行异常被修复时,存储所有异常以及每个异常对应的修复策略。
[0012]可选的,所述通过dmesg日志文件、lscpu命令的输出以及操作系统/proc/cpuinfo的输出检测硬件是否存在异常的步骤,包括:
[0013]解析dmesg日志文件,若dmesg日志文件中存在第一关键词,则检测结果为服务器的内存硬件存在异常;
[0014]解析dmesg日志文件,若dmesg日志文件中存在第二关键词,则检测结果为磁盘或者RAID卡硬件存在异常;
[0015]解析dmesg日志文件,若dmesg日志文件中存在第三关键词,则检测结果为PCI设备存在异常;
[0016]解析lscpu命令的输出和操作系统/proc/cpuinfo的输出,若lscpu命令的输出和/proc/cpuinfo的输出不匹配,或,/proc/cpuinfo中的processer数量偏低,则检测结果为CPU硬件异常。
[0017]可选的,所述通过dmesg日志文件、目录或文件权限、/etc/group文件以及ls命令检测系统是否存在异常的步骤,包括:
[0018]检查dmesg日志文件,若dmesg日志文件中存在第四关键词,则检测结果为系统中的节点文件系统存在异常;
[0019]将所有目录或文件权限与权限模板进行匹配,若所有目录或文件权限与权限模板无法匹配,则检测结果为系统中的目录或文件权限存在异常;
[0020]解析/etc/group文件,若/etc/group文件中不存在第四关键词,则检测结果为系统中的/etc/group文件存在异常;
[0021]通过ls命令获取被检测的服务器上的常用文件的信息,将被检测的服务器上的常用文件的信息与云服务器中记录的文件信息进行匹配,若被检测的服务器上的常用文件的信息与云服务器中记录的文件信息无法匹配,则检测结果为系统中的文件类型存在异常。
[0022]可选的,所述通过systemctl命令检测基础服务是否存在异常的步骤,包括:
[0023]通过systemctl命令获取基础服务的状态;
[0024]若所述状态为休眠状态,则检测结果为基础服务存在异常。
[0025]可选的,所述通过top命令的输出以及free

h命令的输出检测资源占用是否存在异常的步骤,包括:
[0026]解析top命令的输出,若top命令的输出中CPU的空闲比例小于第一预设值,则检测结果为CPU占用异常;
[0027]解析free

h命令的输出,若free

h命令的输出中剩余内存值小于第二预设值,则检测结果为内存占用异常。
[0028]可选的,所述通过nova模块、cinder模块、numactl命令的输出、配置文件/etc/my.cnf以及数据库检测配置是否存在异常的步骤,包括:
[0029]当集群达到预设数量后,检测nova模块的配置文件/etc/nova/nova.conf中的workers配置和cinder模块的配置文件/etc/cinder/cinder.conf中的workers配置是否超过第三预设值;
[0030]若超过第三预设值,则检测结果为nova模块和cinder模块中的workers配置异常;
[0031]当集群达到预设数量后,检测数据库是否配置在固态硬盘上;
[0032]若数据库未配置在固态硬盘上,则检测结果为数据库配置异常;
[0033]检测配置文件/etc/my.cnf中的innodb

buffer

pool

size项是否被赋值为第四预设值,若被赋值为第四预设值,则检测结果为数据库配置异常;
[0034]解析numactl命令的输出,若numactl命令的输出中剩余内存值大于第五预设值,则检测结果为NUMA服务配置异常。
[0035]可选的,所述通过产品接口、nova命令的输出、find命令、数据库以及ps命令的输出检测平台中基础部件的运行是否存在异常的步骤,包括:
[0036]通过调用产品接口检测网络是否断开,若断开,则检测结果为网络运行异常;
[0037]通过nova命令对服务列表进行处理和筛选,检测nova命令是否有输出,若有输出,则检测结果为虚拟机运行节点的主机名异常;
[0038]检测通过find命令是否获取到预设路径对应的预设大小的平台系统日志文件信息,若获取到平台系统日志文件信息,则检测结果为平台系统日志文件异常;
[0039]检测备份的数据库是否按时生成,若没有按时生成,则检测结果为数据库备份异常;
[0040]解析ps命令的输出,若ps命令的输出值大于第六预设值,则检测结果为存在内存泄露异常。
[0041]第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种虚拟云桌面故障检测方法,其特征在于,所述虚拟云桌面故障检测方法包括:当自动检测程序被触发后,通过dmesg日志文件、lscpu命令的输出以及操作系统/proc/cpuinfo的输出检测硬件是否存在异常;当硬件不存在异常或硬件异常被修复时,通过dmesg日志文件、目录或文件权限、/etc/group文件以及ls命令检测系统是否存在异常;当系统不存在异常或系统异常被修复时,通过systemctl命令检测基础服务是否存在异常;当基础服务不存在异常或基础服务异常被修复时,通过top命令的输出以及free

h命令的输出检测资源占用是否存在异常;当资源占用不存在异常或资源占用异常被修复时,通过nova模块、cinder模块、numactl命令的输出、配置文件/etc/my.cnf以及数据库检测配置是否存在异常;当配置不存在异常或配置异常被修复时,通过产品接口、nova命令的输出、find命令、数据库以及ps命令的输出检测平台中基础部件的运行是否存在异常;当平台中基础部件的运行不存在异常或基础部件的运行异常被修复时,存储所有异常以及每个异常对应的修复策略。2.如权利要求1所述的虚拟云桌面故障检测方法,其特征在于,所述通过dmesg日志文件、lscpu命令的输出以及操作系统/proc/cpuinfo的输出检测硬件是否存在异常的步骤,包括:解析dmesg日志文件,若dmesg日志文件中存在第一关键词,则检测结果为服务器的内存硬件存在异常;解析dmesg日志文件,若dmesg日志文件中存在第二关键词,则检测结果为磁盘或者RAID卡硬件存在异常;解析dmesg日志文件,若dmesg日志文件中存在第三关键词,则检测结果为PCI设备存在异常;解析lscpu命令的输出和操作系统/proc/cpuinfo的输出,若lscpu命令的输出和/proc/cpuinfo的输出不匹配,或,/proc/cpuinfo中的processer数量偏低,则检测结果为CPU硬件异常。3.如权利要求1所述的虚拟云桌面故障检测方法,其特征在于,所述通过dmesg日志文件、目录或文件权限、/etc/group文件以及ls命令检测系统是否存在异常的步骤,包括:检查dmesg日志文件,若dmesg日志文件中存在第四关键词,则检测结果为系统中的节点文件系统存在异常;将所有目录或文件权限与权限模板进行匹配,若所有目录或文件权限与权限模板无法匹配,则检测结果为系统中的目录或文件权限存在异常;解析/etc/group文件,若/etc/group文件中不存在第四关键词,则检测结果为系统中的/etc/group文件存在异常;通过ls命令获取被检测的服务器上的常用文件的信息,将被检测的服务器上的常用文件的信息与云服务器中记录的文件信息进行匹配,若被检测的服务器上的常用文件的信息与云服务器中记录的文件信息无法匹配,则检测结果为系统中的文件类型存在异常。4.如权利要求1所述的虚拟云桌面故障检测方法,其特征在于,所述通过systemctl命
令检测基础服务是否存在异常的步骤,包括:通过systemctl命令获取基础服务的状态;若所述状态为休眠状态,则检测结果为基础服务存在异常。5.如权利要求1所述的虚拟云桌面故障检测方法,其特征在于,所述通过top命令的输出以及free

h命令的输出检测资源占用是否存在异常的步骤,包括:解析top命令的输出,若top命令的输出中CPU的空闲比例小于第一预设值,则检测结果为CPU占用异常;解析free

h命令的输出,若free

h命令的输出中剩余内存值小于第二预设值,则检测结果为内存占用异常。6.如权利要求1所述的虚拟云桌面故障检测方法,其特征在于,所述通...

【专利技术属性】
技术研发人员:羿中引
申请(专利权)人:武汉噢易云计算股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1