【技术实现步骤摘要】
一种基于QPSO
‑
MSVM的控制集群故障检测方法
[0001]本专利技术属于集群高可用
,特别是一种基于多类支持向量机和量子粒子群优化的控制集群故障检测方法。
技术介绍
[0002]近年来,由于计算机技术的迅猛发展,集群系统被广泛应用于各行各业,集群系统中节点数量不断增加,网络架构日益复杂,使得集群系统功能逐渐复杂,但同时也对集群系统的可用性提出了更高的要求。基于SDN的控制集群系统在航空航天领域中具有很好的应用前景。其故障通常由硬件故障和软件故障引起,这些故障是随机产生的且有时难以再现,系统管理人员也很难在系统运行时手动跟踪其状态。因此,集群系统中必须采用故障检测技术,故障检测是故障恢复的前提。由于控制集群系统的复杂结构和动态变化特性,现有的故障检测方法的检测效率及检测准确率还有待提高,且监测系统需要从网络和节点的各个层次搜集大量资源的监测数据来跟踪节点的运行状态,故障检测器分析如此大规模的数据将会带来巨大的资源开销。因此,亟需提出一个能够更好地适应集群系统的故障检测方法来提高集群系统的可用性。< ...
【技术保护点】
【技术特征摘要】
1.一种基于QPSO
‑
MSVM的控制集群故障检测方法,其特征在于,包括如下步骤:步骤1,分析目标控制集群系统,根据基于SDN的控制集群系统中软硬件的多样性和复杂性、以及网络结构和流量这些性能要素对目标控制集群系统的故障进行分类,并构建特征向量;步骤2,根据SDN控制集群故障的分类特征实时采集特征向量,并将采集到的特征向量分为训练样本和测试样本;步骤3,采用一对多支持向量机算法,构建基于改进的多类SVM的控制集群故障检测模型;步骤4,通过量子粒子群算法优化多类SVM的控制集群故障检测模型中的参数;步骤5,将采集到的特征向量中的训练样本分为四组,采用一对多SVM分类算法得到四个不同的控制集群故障分类器,构建多类SVM控制集群故障检测分类器;步骤6,将测试样本作为输入样本,通过多类SVM控制集群故障检测分类器进行故障检测,输出控制集群故障检测结果。2.根据权利要求1所述的基于QPSO
‑
MSVM的控制集群故障检测方法,其特征在于,步骤1中将目标控制集群系统的故障T分为四类:T1为控制集群系统故障特征向量、T2为控制集群程序故障特征向量、T3为控制集群网络故障特征向量,T4为控制集群系统主机节点故障特征向量,其定义分别如式(1)
‑
(4)所示:T1=<SRT,SDT,STP,CRU>
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)T2=<PDT,POT,PBT,IOC>
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)T3=<NFT,ND,NPL,NCP>
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)T4=<CP,MP,DP,IOP>
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)其中,T1包含系统运行时间SRT、系统宕机时间SDT、系统吞吐量STP、系统资源利用率CRU;T2包含进程死锁时间PDT、进程超时时间POT、程序崩溃时间PBT、非法操作次数IOC;T3包含网络故障时间NFT、网络延迟ND、网络丢包率NPL、网络覆盖率NCP;T4包含CPU使用率CP、内存使用率MP、磁盘使用率DP、I/O使用率IOP。3.根据权利要求2所述的基于QPSO
‑
MSVM的控制集群故障检测方法,其特征在于,步骤2在实时采集特征向量时,分别通过以下公式计算特征向量T1,T2,T3,T4的动态值,具体步骤如下:步骤2.1,统计系统运行时间SRT,统计系统宕机时间SDT,计算系统吞吐量STP方法如式(5)所示,计算系统资源利用率CRU方法如式(6),STP=An/At
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)CRU=Rc/Rn
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)其中,An表示系统请求总数,At表示系统请求总时长,Rn表示系统资源总量,Rc表示系统实时资源使用量;步骤2.2,统计进程死锁时间PDT,统计进程超时时间POT,统计程序崩溃时间PBT、统计非法操作次数IOC;步骤2.3,统计网络故障时间NFT,统计网络延迟ND,计算网络丢包率NPL方法如式(7)所示,计算网络覆盖率NCP方法如式(8)所示,NPL=Pl/Pn
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
NCP=Cr/Cn
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)其中,Pn表示所传数据包总数,Pl表示数据包丢失数,Cn表示网络可连通的节点总数,Cr表示网络可正常连通的节点数;步骤2.4,计算CPU使用率CP方式如式(9)所示,计算内存使用率MP方式如式(10)所示,计算磁盘使用率DP方式如式(11)所示,计算I/O使用率IOP方式如式(12)所示:CP=1
‑
Ft/Tn
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)MP=Mu/Mn
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)DP=Du/Dn
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)IOP=IOt/IOn
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(12)其中,Tn表示总的CPU时间,Ft表示空闲时间,Mn表示总内存的大小,Mu表示已使用内存大写,Dn表示磁盘总空间,Du表示进程运行时所战用的磁盘空间,IOt表示间隔时间内的I/O数,IOn表示I/O总数。4.根据权利要求3所述的基于QPSO
‑
MSVM的控制集群故障检测方法,其特征在于,步骤3中采用一对多支持向量机算法,构建构建基于改进的多类SVM的控制集群故障检测模型即MSVM的控制集群故障检测模型,模型构建步骤如下:步骤3.1,给定N个由步骤2中的特征向量作为样本的训练集X={x1,x2,
…
,x
N
},对训练集中所有的样本进行预测,其值为y;若故障类型被划分为M类,则y∈{1,2,
…
,M},用F
i
(x)表示第i类集群故障检测分类器的决策函数,其计算方法如式(13):F
i
(x)=(w
i
)
T
φ(x)+ρ
i
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(13)其中,w
i
...
【专利技术属性】
技术研发人员:许涛,杨博,庄毅,顾晶晶,
申请(专利权)人:南京航空航天大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。