当前位置: 首页 > 专利查询>三峡大学专利>正文

基于有监督深度学习的分子云致密结构证认方法技术

技术编号:39900509 阅读:10 留言:0更新日期:2023-12-30 13:14
基于有监督深度学习的分子云致密结构证认方法,首先使用检测算法提取出致密结构候选体,通过人工证认制作数据标签,对所有输入模型中的样本数据进行预处理;然后,训练

【技术实现步骤摘要】
基于有监督深度学习的分子云致密结构证认方法


[0001]本专利技术涉及分子云致密结构检测
,具体涉及一种基于有监督深度学习的分子云致密结构证认方法


技术介绍

[0002]分子云致密结构是星团的诞生地,其形成机制仍存在较大争议

分子云致密结构的物理性质反映了星团形成的初始条件,探测分子云致密结构并研究它们的物理性质将有助于了解星团的形成

传统的分子云致密结构检测算法检测的分子云致密结构候选体,需要结合人工证认筛查与验证候选体来提高数据整体的质量和可信度,从而用于进一步的科学分析

在大型巡天项目中,对于检测到的大量候选致密结构候选体,人工证认效率低且主观性强

因此,迫切需要全自动的分子云致密结构证认方法来取代人工证认

[0003]分子云致密结构具有局部亮度增强

大小不一

形态各异及轮廓模糊等特点,检测过程较为复杂

传统的分子云致密结构检测算法有
ClumpFind、Dendrogram、Reinhold、getsources


然而,这些算法的重要参数在检测过程中可能需要反复调整,以满足不同观测数据的需要

基于银河画卷开发出的分子云致密结构检测算法有
LDC、ConBased

FacetClumps
算法,这些算法的参数量较少,参数调试的难度也有所降低<br/>。
但是,一些关键参数的设置仍然会对检测结果产生较大影响,需要进一步对检测结果进行证认

使用基于卷积神经网络的证认算法对候选分子云致密结构进行分类,然后剔除虚假的致密结构,可以提高检测致密结构的精度

[0004]在银河系天文数据中,分子云的致密结构通常呈现为三维位置

位置

速度
(PPV)
数据

为了提取这些致密结构的空间特征,使用
3D
卷积神经网络是一种有效的方法

已经有研究使用了
Voxnet
来进行银河画卷
M16
天区分子云致密结构的二分类

然而,在处理大规模数据集时,这种模型容易出现假阳性的预测结果


技术实现思路

[0005]为解决上述技术问题,本专利技术提供一种基于有监督深度学习的分子云致密结构证认方法,相比传统的检测算法,该方法能够更有效地提取分子云致密结构的特征;同时该方法基于输出的置信度,采用双阈值划分将检测到的候选体分类,能够过滤掉虚假的致密结构候选体,从而提高结果的可信度

[0006]本专利技术采取的技术方案为:
[0007]基于有监督深度学习的分子云致密结构证认方法,包括以下步骤:
[0008]步骤1:获取分子云致密结构样本,通过人工证认制作数据标签,对分子云致密结构样本进行预处理;
[0009]步骤2:基于分子云致密结构候选体训练
MCVnet
证认模型,提取分子分子云致密结构候选体的特征;
[0010]步骤3:将训练好的
MCVnet
证认模型,对分子云致密结构候选体数据进行证认,获
得每个分子云致密结构候选体为真实致密结构的概率;
[0011]步骤4:将分子云致密结构的置信度分布制定类别,输出最终分类结果

[0012]所述步骤1包括以下步骤:
[0013]S1.1
:采用
LDC
算法检测观测数据中的分子云致密结构,将
ClumpFind
算法检测到的分子云致密结构与
LDC
算法检测到的分子云致密结构进行匹配,不能匹配的分子云致密结构被保存到
FITS
文件中,作为候选体的负样本;
[0014]S1.2
:将检测算法检测生成的掩膜与原始观测数据相乘,即可得到不带任何背景的分子云致密结构候选体数据,绘制出分子云致密结构的
x

y、x

v

y

v
平面的积分强度图

最大谱图和平均谱图,然后,根据这些图以多人投票的方式进行证认,筛选出正

负样本
。S1.3
:采用最大最小归一化方法对单个含有背景的分子云致密结构数据进行处理,将其强度值映射到
[0,1]内,公式如下:
[0015][0016]其中:
x
是三维分子云致密结构数据的原始强度值;
x
normalized
是归一化后的强度值,
min(x)
是数据中的最小强度值;
max(x)
是数据中的最大强度值

[0017]所述步骤2中,将预处理后的分子云致密结构候选体分批次送入
MCVnet
证认模型进行训练,采用随机梯度下降
(Stochastic Gradient Descent)
算法来更新过滤器的权重,以最小化二元交叉熵损失函数

[0018]过滤器的权重通常是指神经网络中各个层的权重参数


MCVnet
模型中,这些权重是模型在不同层之间的连接权重,用于捕获输入特征和输出结果之间的关系

[0019]二元交叉熵损失函数是用于衡量分类问题中模型预测与实际标签之间差异的一种损失函数
,
它的数学表示为:
[0020][0021]其中
,y
是实际的标签
(0

1)
,是模型预测的标签
(0
到1之间的概率
),N
为所有样本的数量

实际标签与模型预测的概率越接近越好,对应的损失越小

[0022]采用指数衰减的学习率衰减策略,初始学习率为
0.0001
,每经过
10000
步训练进行一次衰减,衰减基数为
0.96
;当二元交叉熵损失函数和准确率趋于稳定时,停止训练,保存模型

所述步骤3中,每个分子云致密结构候选体为真实致密结构的概率是通过步骤2中的已训练好的
MCVnet
模型预测得到的输出
。MCVnet
模型在输出时经过
softmax
函数进行激活来得到每个候选体属于各个类别的概率分布;
Softmax
公式为:
[0023][0024]其中,
z
i

MCVnet
模型在最后一个全连接层的输入;
C
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
基于有监督深度学习的分子云致密结构证认方法,其特征在于包括以下步骤:步骤1:获取分子云致密结构样本,通过人工证认制作数据标签,对分子云致密结构样本进行预处理;步骤2:基于分子云致密结构候选体训练
MCVnet
证认模型,提取分子分子云致密结构候选体的特征;步骤3:将训练好的
MCVnet
证认模型,对分子云致密结构候选体数据进行证认,获得每个分子云致密结构候选体为真实致密结构的概率;步骤4:将分子云致密结构的置信度分布制定类别,输出最终分类结果
。2.
根据权利要求1所述基于有监督深度学习的分子云致密结构证认方法,其特征在于:所述步骤1包括以下步骤:
S1.1
:采用
LDC
算法检测观测数据中的分子云致密结构,将
ClumpFind
算法检测到的分子云致密结构与
LDC
算法检测到的分子云致密结构进行匹配,不能匹配的分子云致密结构被保存到
FITS
文件中,作为候选体的负样本;
S1.2
:将检测算法检测生成的掩膜与观测数据相乘,即可得到不带任何背景的分子云致密结构候选体数据,绘制出分子云致密结构的
x

y、x

v

y

v
平面的积分强度图

最大谱图和平均谱图,然后,根据这些图以多人投票的方式进行证认,筛选出正

负样本;
S1.3
:采用最大最小归一化方法对单个含有背景的分子云致密结构数据进行处理,将其强度值映射到
[0,1]
内,公式如下:其中:
x
是三维分子云致密结构数据的原始强度值;
x
normalized
是归一化后的强度值,
min(x)
是数据中的最小强度值;
max(x)
是数据中的最大强度值
。3.
根据权利要求1所述基于有监督深度学习的分子云致密结构证认方法,其特征在于:所述步骤2中,将预处理后的分子云致密结构候选体分批次送入
MCVnet
证认模型进行训练,采用随机梯度下降
(Stochastic Gradient Descent)
算法来更新过滤器的权重,以最小化二元交叉熵损失函数
。4.
根据权利要求3所述基于有监督深度学习的分子云致密结构证认方法,其特征在于:二元交叉熵损...

【专利技术属性】
技术研发人员:黄瑶龙晨郑胜曾曙光曾祥云罗骁域
申请(专利权)人:三峡大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1