一种基于双分支对称残差模块和LSTM的光变曲线分类方法技术

技术编号:38721975 阅读:17 留言:0更新日期:2023-09-08 23:16
本发明专利技术公开了一种基于双分支对称残差模块和LSTM的光变曲线分类方法,共包含两个相同的分支,可对输入特征的不同部分进行多次处理和特征提取,实现参数共享。对于每一个分支,都包含卷积神经模块和循环神经模块,在卷积神经模块中,首先利用一次卷积提取浅层特征,然后利用残差结构提取深层特征。在循环神经模块中,LSTM能够捕捉和建模时序特征中的长期依赖关系,融合卷积神经模块和循环神经模块的特征,最后融合特征被输入到多个dense层,利用softmax函数得到每一条光变曲线的类别。通过准确率、精确率、召回率评估分类的有效性。本发明专利技术与传统的光变曲线分类方法相比具有更高的准确率、精确率、召回率,在数据不平衡的情况下仍能取得很好的分类效果。仍能取得很好的分类效果。仍能取得很好的分类效果。

【技术实现步骤摘要】
一种基于双分支对称残差模块和LSTM的光变曲线分类方法


[0001]本专利技术属于光变曲线分类
,特别涉及了一种基于双分支对称残差模块和LSTM的光变曲线分类方法。

技术介绍

[0002]光变曲线是指天体在不同时间观测下的光度变化曲线,光变曲线可以提供天体的周期性、非周期性或随机的光度变化信息。光变曲线的分类可以提供关于天体物理机制的线索,不同类型的光变曲线反映了不同的物理过程,通过对不同类型光变曲线的分析和比较,可以深入研究这些物理机制,从而增进对天体物理的理解,帮助预测和监测天体事件的发生。当前光变曲线分类方法主要有依靠传统特征工程的分类器方法和基于卷积神经网络的机器学习方法。传统特征工程的分类器方法主要是,通过对光变曲线进行计算,参数化光变曲线,将蕴含光变曲线的特征输入到分类器中,上述传统特征工程的分类器方法对光变曲线的成像质量和计算方法要求很高,往往需要大量复杂计算才能取得比较好的效果。光变曲线分类的另一个重要方法是基于卷积神经网络的机器学习方法,主要是依靠光变曲线的曲线变化,对光变曲线的成像质量依赖性很大,光变曲线中噪声和时间间隙的存在,会损失曲线的置信度,导致分类精度不高。

技术实现思路

[0003]本专利技术的目的是为了克服上述背景中的不足,提供一种基于双分支对称残差模块和LSTM的光变曲线分类方法,克服了传统光变曲线分类方法精度不高、鲁棒性差以及需要复杂特征工程的缺陷。此外相比其它的光变曲线分类算法,本专利技术的精度更高。为了实现上述技术目的,本专利技术的技术方案为:
[0004]一种基于双分支对称残差模块和LSTM的光变曲线分类方法,包括多分支对称结构;
[0005]所述多分支对称结构具有相同的结构和参数,每个分支都可以独立地学习和提取特征,对输入特征的不同部分进行多次处理和特征提取,共享相同的权重和偏置,可以减少需要学习的参数数量,多分支对称结构可以通过融合不同分支的特征来增强模型的表达能力,增强对复杂数据的适应能力,增强模型的鲁棒性。
[0006]所述多分支对称结构包括卷积神经模块和循环神经模块,卷积神经模块用于进行特征提取,捕捉数据中的趋势、周期性或重要的突变点,所提取的深层特征和浅层特征可以作为循环神经模块的输入;
[0007]所述循环神经模块采用长短时记忆模块LSTM,能够在当前时间利用过去的信息,对序列特征进行逐个时间步的处理,捕捉特征的时间依赖关系和长期记忆,LSTM可以从卷积神经模块提取的深层特征和浅层特征中提取深度和时间信息的特征,捕捉和建模序列特征中的长期依赖关系,在不同的时间尺度上,从卷积神经模块提取的特征中发现不同观测值之间的关联,可以更好地利用过去和现在的信息,挖掘数据中的深层时间特征,融合卷积
神经模块和循环神经模块,在处理光变曲线特征时同时考虑局部和全局的上下文信息,更好的建模长期依赖关系。
[0008]所述卷积神经模块包含普通卷积和残差结构,普通卷积首先对输入的特征进行一次卷积、池化、激活函数,用于提取光变曲线中的浅层特征;
[0009]残差结构中的恒等映射被改为一次卷积、池化、激活函数,恒等映射可以在不添加额外参数或增加计算复杂度的情况下加深网络,用于提取光变曲线中的深层特征,若提取的特征变好,最终输出的是两次卷积、池化、激活函数的结果,若提取的特征变差,最终输出的是一次卷积、池化、激活函数的结果,修改过的残差结构既可以利用恒等映射加深网络,又可以加速特征的提取速度;
[0010]所述残差结构中的卷积层特征图的大小保持不变,特征图的大小保持不变可以确保在网络的不同层之间共享特征,能够在不丢失输入特征空间信息的同时,进行局部特征的提取和学习,可以使得低层的特征在更高层得到重复利用,增强网络对特征的表征能力,卷积层的参数是在整个输入特征图上共享的,特征图的大小保持不变使得卷积层具有较少的参数量,从而减少了过拟合的风险,提高了模型的泛化能力;
[0011]所述多分支对称结构包括多个dense层,dense层学习权重和偏置参数,将输入特征与权重矩阵相乘并添加偏置项,实现输入特征到输出特征的线性变换和非线性映射,能够将输入特征从低维度映射到高维度,每一个神经元都与上一层的所有神经元相连接,将上一层的特征进行加权组合和非线性变换,提取并表示更高级的特征,多个dense层可以逐渐学习到更加抽象和高层次的特征,层级化的特征提取能力有助于网络学习到更复杂的模式和语义信息;
[0012]dense层函数可用下式表示:
[0013]y=activation(Wx+b)
[0014]其中,W是权重矩阵,x是前一层的输出,b是偏置向量,activation表示激活函数。
[0015]softmax激活函数将dense层的输出转换为每个类别的概率分布,通过准确率、精确率、召回率评估光变曲线分类的有效性;
[0016]softmax函数可用下式表示:
[0017][0018]其中,x
i
和x
j
分别是i类和j类的特征值。
[0019]本专利技术还公开了一种基于双分支对称残差模块和LSTM的光变曲线分类方法,包括以下步骤:
[0020]S1:对光变曲线分类网络进行训练:利用标注好的样本(X
i
,Y
i
)进行训练,得到训练好的模型权重参数,其中X
i
表示一个1
×
N的一维特征,Y
i
表示其对应的标签,i代表第i个样本,i=1,2,3...x,x为训练样本总数;
[0021]S2:加载训练好的模型参数,画出混淆矩阵、假阳性率和真阳性率为横坐标和纵坐标的受试者工作特征曲线和精确率召回率曲线,评估光变曲线分类模型的有效性,计算准确率、召回率和精确率,评估光变曲线数量在不均衡情况下的分类准确程度;
[0022]S3:利用S2的分类结果,对合并的类别之间进行聚类并再次进行分类,聚类之后类别之间的重叠情况符合混淆矩阵的混淆情况。
[0023]有益效果:本专利技术与现有技术相比,首次采用多分支对称卷积神经模块和循环神经模块进行光变曲线特征提取。本专利技术相比传统分类器方法精度更高、鲁棒性更好以及不需要复杂的特征工程。本专利技术相比基于卷积神经网络的光变曲线分类方法,卷积神经模块和循环神经模块的融合克服了单一卷积神经模块损失时间信息的问题,分类精度更高。
附图说明
[0024]图1是本专利技术中用双分支对称残差模块和LSTM进行光变曲线分类的结构示意图;
[0025]图2是本专利技术双分支对称残差模块和LSTM提取的不同深度的特征示意图;
[0026]图3是本专利技术的基本流程图。
具体实施方式
[0027]下面结合附图进一步对本专利技术的内容进一步阐述。
[0028]如图1所示,多分支对称结构具有相同的结构和参数,可以共享相同的权重和偏置,减少需要学习的参数数量,降低模型的复杂度,增强模型的鲁棒性;
[0029]卷积神经模块中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于双分支对称残差模块和LSTM的光变曲线分类方法,其特征在于:多分支对称结构;多分支对称结构具有相同的结构和参数,每个分支都可以独立地学习和提取特征,对输入特征的不同部分进行多次处理和特征提取,共享相同的权重和偏置,可以减少需要学习的参数数量,多分支对称结构可以通过融合不同分支的特征来增强模型的表达能力,增强对复杂数据的适应能力,增强模型的鲁棒性。2.根据权利要求1所述,一种基于双分支对称残差模块和LSTM的光变曲线分类方法,其特征在于:融合卷积神经模块和循环神经模块;所述卷积神经模块用于进行特征提取,捕捉数据中的趋势、周期性或重要的突变点,所提取的深层特征和浅层特征可以作为循环神经模块的输入;所述循环神经模块是长短时记忆模块LSTM,能够在当前时间利用过去的信息,对序列特征进行逐个时间步的处理,捕捉特征的时间依赖关系和长期记忆,LSTM可以从卷积神经模块提取的深层特征和浅层特征中提取深度和时间信息的特征,捕捉和建模序列特征中的长期依赖关系,在不同的时间尺度上,从卷积神经模块提取的特征中发现不同观测值之间的关联,可以更好地利用过去和现在的信息,挖掘数据中的深层时间特征。3.根据权利要求1所述,一种基于双分支对称残差模块和LSTM的光变曲线分类方法,其特征在于:所述卷积神经模块包括卷积模块和残差结构;所述卷积模块首先对输入的特征进行一次卷积、池化、激活函数,用于提取光变曲线中的浅层特征;所述残差结构中的恒等映射被改为一次卷积、池化、激活函数,恒等映射可以在不添加额外参数或增加计算复杂度的情况下加深网络,用于提取光变曲线中的深层特征,若提取的特征变好,最终输出的是两次卷积、池化、激活函数的结果,若提取的特征变差,最终输出的是一次卷积、池化、激活函数的结果,修改过的残差结构既可以利用恒等映射加深网络,又可以加速特征的提取速度。4.根据权利要求1所述,一种基于双分支对称残差模块和LSTM的光变曲线分类方法,其特征在于:使用多个dense层;dense层学习权重和偏置参数,将输入特征与权重矩阵相乘并添加偏置项,实现输入特征到输出特征的线性变换和非线性映射,能够将输入特征从低维度映射到高维度,每一个神经元都与上一层的所有神经元相连接,将上一层的特征进行加权组合和非线性变换,提...

【专利技术属性】
技术研发人员:邱波闫静王晓敏
申请(专利权)人:河北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1