一种基于CNN与LSTM的复合恒星光谱分类方法技术

技术编号：37997310 阅读：7 留言：0更新日期：2023-06-30 10:11

本发明专利技术涉及一种基于CNN与LSTM的复合恒星光谱分类方法，其主要技术特点是：结合卷积神经网络和长短时记忆网络优点新设计出的CNN

全部详细技术资料下载

【技术实现步骤摘要】
一种基于CNN与LSTM的复合恒星光谱分类方法

[0001]本专利技术属于光谱分类领域，尤其是一种基于CNN与LSTM的复合恒星光谱分类方法。

技术介绍

[0002]恒星光谱分类工作是天文学中很重要的研究领域之一。由于目前科学技术的飞速发展，由各大巡天望远镜收集的恒星光谱数据量已经达到了TB甚至PB的量级，传统的分类方法已经无法满足对这样大的数据量处理需求。面对这种海量的天文光谱数据，如何自动、高效、准确的分类它们是目前的天文学家们所要解决的问题之一。深度学习领域的出现大大解决了这种海量数据的处理问题，帮助天文学家更快更准确的利用这些信息，并快速准确的将这些光谱进行分类，供天文学家进行使用。
[0003]在恒星光谱数据的分类研究方面，很多工作者都使用了一些传统的方法。蔡江辉等利用谓词逻辑的分类规则后处理方法，提高了光谱自动分类的效率，但是分类结果的准确率并没有得到提升。刘杰等将多种聚类算法应用到早M型矮恒星光谱，聚类产生的簇心数据和MK分类吻合很好，但是应用的领域过于局限。Wang等使用受限玻尔兹曼机(RBM)、基于伪逆学习算法的深度神经网络(PILDNN)、将每条光谱作为输入向量时分为4个阶段并基于伪逆学习算法的深度神经网络(PILDNN*)进行了LAMOST中F、G、K三分类的任务，结果较传统机器学习的方法准确率有所提升但没有提升很多。许婷婷等提出一种深度信念网络(DBN)对光谱数据进行分层特征学习，将其应用在F、G、K，3种恒星光谱的分类中，实验说明深度信念网络在综合性能上优于RBM、PILDNN、PI...

【技术保护点】

【技术特征摘要】
1.一种基于CNN与LSTM的复合恒星光谱分类方法，其特征在于包括以下步骤：步骤1：从LAMOST DR8数据库中选取带有光谱种类的目标种类恒星光谱实验数据，如G型恒星光谱图像，并将这些数据进行标准化处理。步骤2：将取得的恒星光谱数据随机划分为训练集、验证集、测试集。步骤3：设计CNN
‑
LSTM复合分类模型，模型的输入层是长度为3700*1的光谱数据，第一个卷积层的卷积核尺寸设置为15*1，滤波器的个数为20个，激活函数使用Relu。第一个最大池化层使用卷积核的尺寸是5*1，滤波器的个数为20个。第二个和第三个卷积层、最大池化层和第一个卷积层池化层配置一样。第四个卷积层的卷积核尺寸设置为6*1，滤波器的个数为15个，激活函数使用Relu。第四个最大池化层使用卷积核的尺寸是3*1，滤波器的个数为15个。紧接着后面设计了一个LSTM层，输出大小为128，激活函数使用的是tanh，为了防止数据过拟合，后面接了一个Dropout函数，配置为0.3。后面设计了一个全连接层包含了1024个神经元，激活函数使用Relu。这里也涉及了一个Dropout函数，配置为0.3。最后的输出层设置3个或10个神经元，用于表示分类的光谱类别的概率，再用Softmax就可以将多分类的输出值转换为范围在[0，1]，和为1的概率。步骤4：设置模型每次读取的数据样本量batchsize、训练次数Epoch、梯度下降的学习率l。步骤5：使用训练集，验证集进行CNN
‑
LSTM复合分类模型训练，并保存训练完成模型的权重。步骤6：使用训练完成的模型进行在测试集中测试模型的分类性能。2.根据权利要求1所述的基于CNN与LSTM的复合恒星光谱分类方法，其特征在于：所述步骤1从LAMOST DR8数据库中选取带有光谱种类的目标种类恒星光谱实验数据，如G型恒星光谱图像，并将这些数据进行标准化处理。为了消除不同光谱的流量强度数值大小相差很大的影响，这里我们引入了Z
‑
Score标准化(zero
‑
mean normalization)方法，它的公式为：式中S
N
＝(S1，S2，
…
，Sn)表示原始恒星光谱数据，S1，S2，
…
，Sn表示给定波长下的流量强度值，S
S
表示归一化后的恒星光谱数据，μ表示S
N
中的流量强度值的平均值，σ表示S
N
中的流量强度值的标准差。Z
‑
Score标准化后的恒星光谱数据具有与原始光谱相同的数量级，并仍然保持了原始光谱数据特征之间的相对大小关系。3.根据权利要求1所述的基于CNN与LSTM的复合恒星光谱分类方法，其特征在于：所述步骤2将取得的恒星光谱数据使用sklearn.model_selection库中的train_test_split()函数随机划分为训练集、验证集、测试集。4.根据权利要求1所述的基于CNN与LSTM的复合恒星光谱分类方法，其特征在于：所述步骤3卷积神经网络是深度学习模型中最典型的模型。它通常由输入层、卷积层、激活函数、最大池化层、全连接层、输出层组成。输入层输入需要处理的数据。卷积层是CNN中的核心组成部分，它可以提取数据中的隐含特征。最大池化层可以挑选不受位置干扰的隐含信息，并对数据进行降维，提高特征提取的感受野。全连接层将提取的特征转化为一维向量，用于后续进行分类。输出层使用Softmax分类器，将多个神经元的输出到[0，1]之间，选取概率最大
的结点作为预测结果。长短期记忆网络(long short
‑
term memory，LSTM)，它是一种在循环神经网络(Rerrent Neural Network，RNN)会出现梯度爆炸、只能提供短时记忆的的缺点上改进的模型。LSTM网络模型设计了三个“门”，它们是输入门、遗忘门、输出门。利用这三个门，可以去保护和控制网络中的细胞状态。输入门用来决定细胞中应该加入哪些新状态。此项设计两部分工作：第一部分工作是通过使用输入门的sigmoid层决定我们要去更新哪些位置上的值，第二部分工作是通过tanh层生成一个候选值组成可加到细胞状态上的向量。输入门状态更新公式：i
t
＝σ(W
i
·
[h
t
‑...

【专利技术属性】
技术研发人员：赵青，李浩，张成奎，张梦祥，孙乐，
申请(专利权)人：天津科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人