深度聚类变分自编码器和基于它的电信号聚类分析方法技术

技术编号:38493224 阅读:18 留言:0更新日期:2023-08-15 17:05
本发明专利技术涉及一种飞行器电信号聚类分析的深度变分自编码器算法。包括:变分自编码器模块,多尺度残差卷积网络模块和信号聚类模块。飞行器电信号进行聚类分析时(101),首先进行信号采集与传输(102),送入多尺度残差卷积模块(103)和最大池化层(104)完成特征提取,将特征映射分别通过两个并列的全连接层(105)和(106)得到特征均值(107)与特征方差(108),之后通过解码器网络,采用与编码器完全对称的结构,最终输出重构信号(113),旨在与输入信号完全匹配。通过构建损失函数与两阶段训练方式对网络进行训练,最终通过重构特征向量(109)完成聚类分析(115)。成聚类分析(115)。成聚类分析(115)。

【技术实现步骤摘要】
深度聚类变分自编码器和基于它的电信号聚类分析方法


[0001]本专利技术涉及一种深度聚类变分自编码器和基于它的电信号聚类分析方法。

技术介绍

[0002]在飞行器的运行测试过程中,各路传感器所采集的连续时序信号是数据集的主要来源。由于传感器采集到的数据集多为无标签样本,如果要对数据进行进一步分析,尤其是通过分类手段实现对信号的识别与监测,就需要对数据进行截取与分析。通过领域专家的人工手段,对各类信号进行合理标注,构建出带标签的数据集,形成专家数据库,从而才能在后续工作中对分类器模型进行有监督训练,构建信号识别系统。
[0003]然而,对于含有大量数据的数据库和数据集,其数据量巨大且数据复杂,信号条目数高达数十万条,每条均为数据长度超过几千的长时序数据。对于大量的复杂数据,进行人工分类的时间、人力成本极高,快速地对大量数据进行标签化是一项艰难且费时费力的任务。在机器学习领域中,针对无标签的数据,可以通过无监督学习的手段,对数据进行自动归类整理,这类无监督学习算法被称为聚类分析算法。由于同类别信号数据具有一定相似性,采用聚类分析算法对多类别本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种针对飞行器电信号聚类任务的深度变分自编码器,其特征在于包括:变分自编码器模块;信号聚类模块,其中:所述变分自编码器模块包括:编码器、重构层与解码器,编码器包括:信号采集与传输模块(102),用于在对飞行器电信号进行聚类分析时进行信号采集与传输(101);第一多尺度残差膨胀卷积模块(103),用于接收信号采集与传输模块(102)采集到的电信号;最大值池化层(104),用于结合第一多尺度残差膨胀卷积模块(103)进行堆栈,由所述电信号得到特征映射;并列的第一全连接层(105)和第二全连接层(106),所述特征映射分别通过并列的第一全连接层(105)和第二全连接层(106),分别得到特征均值(107)与特征方差(108);重构层(109)用于把特征均值与特征方差重构成特征向量,作为解码器网络模块的输入,解码器包括:第三全连接层(110),上采样层(111),第二多尺度残差膨胀卷积模块(112),上采样层(111)结合第二多尺度残差膨胀卷积模块(112),进行最大值池化层(104)的反向运算,且所述特征向量经过第三全连接层(110)进入到上采样层(111),重构模块(113),用于对解码器的输出进行重构,以与编码器的输入完全匹配;所述信号聚类模块包括:第四全连接层(114),用于对重构的特征向量进行特征变换,最终层(115),用于把第四全连接层(114)进行特征变换后的重构的特征向量结合Softmax函数,输出聚类结果,其中,在所述第一和第二多尺度残差膨胀卷积模块中:设原始数据X在其维度空间中满足概率分布p(X),设当前的原始数据样本是从该分布p(X)中采样所得到的样本x,通过构建隐含变量Z来表示X的分布律,即:p(X|Z)就表征了一个由Z生成样本X的模型,通过在分布内调整向量Z中的值,所生成的样本X也将满足数据集X在其维度空间的分布,在编码过程中,变分自编码器模块拟合出两个长度相等的向量,分别表征Z的均值和方差,变分自编码器模块的网络结构为X与Z的联合分布p(X,Z),使p(X,Z)尽可能地接近一个近似分布q(X,Z),其中q设定为标准正态分布,
为使Z的均值和特征方差能够满足标准正态分布,损失函数除了对重构误差的约束还考虑了Z的分布与标准正态分布的KL散度,即:其中μ为特征均值,σ2为特征方差,N(0,I)为标准正态分布,从而将Z扩展为(Z,Y),其中Y是聚类层输出的离散变量,表征输出类别,由此Z的KL损失就被表征为:其中x表示从X的分布律中采样所得到的样本,z表示隐变量Z中的一维,为使损失函数能够更容易计算:设定p(Z|X)为正态分布,其输出即为Z的均值和特征方差;设定q(X|Z)表示为方差为常数的正态分布;设定q(Z|Y)为均值与Y输出的均值相当、方差为1的正态分布;设定q(Y)为均匀分布,以使类别的分布是均衡的;利用聚类模块对p(Y|Z)进行拟合,把损失函数表征为:其中,三项损失的含义分别是:重构损失用于约束重构信号与输入信号的相似度,通过均方误差计算输入信号与重构信号的误差并进行最小化;KL损失用于约束特征的分布;类别损失用于约束输出聚类类别与特征向量的对应性,通过交叉熵误差来限制聚类结果的输出,实现聚类类别与特征向量的对齐。2.根据权利要求1所述的深度变分自编码器,其特征在于:在KL损失确定中,计算分布p(Y|Z)和分布q(Y)间的KL散度,以约束隐向量的分布情况。3.根据权利要求1所述的深度变分自编码器,其特征在于所述第一和第二多尺度残差膨胀卷积模块各包括:带有不同尺度卷积核的两条支流:

小尺度特征提取支流,其卷积核尺寸为3,用于感知小尺度特征;

大尺度特征提取支流,其的卷积核尺寸为5,用于感知大尺度特征,
通过这两条支流的分别作用,第一和第二多尺度残差膨胀卷积模块可并行地捕捉不同尺度的信号特征,其中:小尺度特征提取支流的第二卷积层采用了膨胀率为2的卷积,大尺度特征提取支流的第一、第二层分别采用了膨胀率为2和5的卷积。4.根据权利要求1-3之一所述的深度变分自编码器,其特征在于采用两阶段训练对深度变分自编码器设进行训练,包括:先进行第一阶段的训练(201),首先迭代步初始化(202),开始一轮训练(203),输入无标签的训练样本(204),对样本信号进行重构(205)并输出聚类结果,对该聚类结果计算误差和损失函数(206),然后采用第一阶段学习率α1反向传播更新网络参数(207),判断是否遍历训练集(208),“否”则返回输入无标签的训练样本的步骤(204),“是”则迭代步数加1(209),再判断轮数是否达到第一阶段的训练轮数个数(210),“否”则返回开始一轮训练的步骤(203),“是”则结束第一阶段训练并开始的第二阶段训练,在第二阶段训练中,继承网络参数并开始多轮训练,区别在于采用第二阶段学习率α2反向传播更新网络参数(217),当轮数达到设定目标后(22...

【专利技术属性】
技术研发人员:李可陈晓丹兰巍王养柱李源淦杨顺昆
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1