【技术实现步骤摘要】
一种基于CNN与LSTM的复合恒星光谱分类方法
[0001]本专利技术属于光谱分类领域,尤其是一种基于CNN与LSTM的复合恒星光谱分类方法。
技术介绍
[0002]恒星光谱分类工作是天文学中很重要的研究领域之一。由于目前科学技术的飞速发展,由各大巡天望远镜收集的恒星光谱数据量已经达到了TB甚至PB的量级,传统的分类方法已经无法满足对这样大的数据量处理需求。面对这种海量的天文光谱数据,如何自动、高效、准确的分类它们是目前的天文学家们所要解决的问题之一。深度学习领域的出现大大解决了这种海量数据的处理问题,帮助天文学家更快更准确的利用这些信息,并快速准确的将这些光谱进行分类,供天文学家进行使用。
[0003]在恒星光谱数据的分类研究方面,很多工作者都使用了一些传统的方法。蔡江辉等利用谓词逻辑的分类规则后处理方法,提高了光谱自动分类的效率,但是分类结果的准确率并没有得到提升。刘杰等将多种聚类算法应用到早M型矮恒星光谱,聚类产生的簇心数据和MK分类吻合很好,但是应用的领域过于局限。Wang等使用受限玻尔兹曼机(RBM)、基于伪逆学习算法的深度神经网络(PILDNN)、将每条光谱作为输入向量时分为4个阶段并基于伪逆学习算法的深度神经网络(PILDNN*)进行了LAMOST中F、G、K三分类的任务,结果较传统机器学习的方法准确率有所提升但没有提升很多。许婷婷等提出一种深度信念网络(DBN)对光谱数据进行分层特征学习,将其应用在F、G、K,3种恒星光谱的分类中,实验说明深度信念网络在综合性能上优于RBM、PILDNN、PI ...
【技术保护点】
【技术特征摘要】
1.一种基于CNN与LSTM的复合恒星光谱分类方法,其特征在于包括以下步骤:步骤1:从LAMOST DR8数据库中选取带有光谱种类的目标种类恒星光谱实验数据,如G型恒星光谱图像,并将这些数据进行标准化处理。步骤2:将取得的恒星光谱数据随机划分为训练集、验证集、测试集。步骤3:设计CNN
‑
LSTM复合分类模型,模型的输入层是长度为3700*1的光谱数据,第一个卷积层的卷积核尺寸设置为15*1,滤波器的个数为20个,激活函数使用Relu。第一个最大池化层使用卷积核的尺寸是5*1,滤波器的个数为20个。第二个和第三个卷积层、最大池化层和第一个卷积层池化层配置一样。第四个卷积层的卷积核尺寸设置为6*1,滤波器的个数为15个,激活函数使用Relu。第四个最大池化层使用卷积核的尺寸是3*1,滤波器的个数为15个。紧接着后面设计了一个LSTM层,输出大小为128,激活函数使用的是tanh,为了防止数据过拟合,后面接了一个Dropout函数,配置为0.3。后面设计了一个全连接层包含了1024个神经元,激活函数使用Relu。这里也涉及了一个Dropout函数,配置为0.3。最后的输出层设置3个或10个神经元,用于表示分类的光谱类别的概率,再用Softmax就可以将多分类的输出值转换为范围在[0,1],和为1的概率。步骤4:设置模型每次读取的数据样本量batchsize、训练次数Epoch、梯度下降的学习率l。步骤5:使用训练集,验证集进行CNN
‑
LSTM复合分类模型训练,并保存训练完成模型的权重。步骤6:使用训练完成的模型进行在测试集中测试模型的分类性能。2.根据权利要求1所述的基于CNN与LSTM的复合恒星光谱分类方法,其特征在于:所述步骤1从LAMOST DR8数据库中选取带有光谱种类的目标种类恒星光谱实验数据,如G型恒星光谱图像,并将这些数据进行标准化处理。为了消除不同光谱的流量强度数值大小相差很大的影响,这里我们引入了Z
‑
Score标准化(zero
‑
mean normalization)方法,它的公式为:式中S
N
=(S1,S2,
…
,Sn)表示原始恒星光谱数据,S1,S2,
…
,Sn表示给定波长下的流量强度值,S
S
表示归一化后的恒星光谱数据,μ表示S
N
中的流量强度值的平均值,σ表示S
N
中的流量强度值的标准差。Z
‑
Score标准化后的恒星光谱数据具有与原始光谱相同的数量级,并仍然保持了原始光谱数据特征之间的相对大小关系。3.根据权利要求1所述的基于CNN与LSTM的复合恒星光谱分类方法,其特征在于:所述步骤2将取得的恒星光谱数据使用sklearn.model_selection库中的train_test_split()函数随机划分为训练集、验证集、测试集。4.根据权利要求1所述的基于CNN与LSTM的复合恒星光谱分类方法,其特征在于:所述步骤3卷积神经网络是深度学习模型中最典型的模型。它通常由输入层、卷积层、激活函数、最大池化层、全连接层、输出层组成。输入层输入需要处理的数据。卷积层是CNN中的核心组成部分,它可以提取数据中的隐含特征。最大池化层可以挑选不受位置干扰的隐含信息,并对数据进行降维,提高特征提取的感受野。全连接层将提取的特征转化为一维向量,用于后续进行分类。输出层使用Softmax分类器,将多个神经元的输出到[0,1]之间,选取概率最大
的结点作为预测结果。长短期记忆网络(long short
‑
term memory,LSTM),它是一种在循环神经网络(Rerrent Neural Network,RNN)会出现梯度爆炸、只能提供短时记忆的的缺点上改进的模型。LSTM网络模型设计了三个“门”,它们是输入门、遗忘门、输出门。利用这三个门,可以去保护和控制网络中的细胞状态。输入门用来决定细胞中应该加入哪些新状态。此项设计两部分工作:第一部分工作是通过使用输入门的sigmoid层决定我们要去更新哪些位置上的值,第二部分工作是通过tanh层生成一个候选值组成可加到细胞状态上的向量。输入门状态更新公式:i
t
=σ(W
i
·
[h
t
‑...
【专利技术属性】
技术研发人员:赵青,李浩,张成奎,张梦祥,孙乐,
申请(专利权)人:天津科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。