一种面向天体光谱数据的自动可视化分析方法及系统技术方案

技术编号:33632188 阅读:43 留言:0更新日期:2022-06-02 01:37
本发明专利技术一种面向天体光谱数据的自动可视化分析方法及系统,属于天文光谱分析、大数据处理与分析技术领域;解决了光谱分析时需要很多繁琐的筛选、画图等工作,以及大量未知类型光谱聚类、离群光谱的寻找与分析缺乏自动化的问题;解决上述技术问题采用的技术方案为:获取光谱数据并预处理;利用SP

【技术实现步骤摘要】
一种面向天体光谱数据的自动可视化分析方法及系统


[0001]本专利技术一种面向天体光谱数据的自动可视化分析方法及系统,属于天文光谱分析、大数据处理与分析


技术介绍

[0002]天文是一门历史悠久的学科,近年来,随着大量巡天项目的陆续实施,我们获取到了大量天文数据去帮助我们分析天体和宇宙,其中天体的光谱包含其大量的物理信息,天体光谱分析对研究星系演化、恒星形成等具有重要意义。将光谱进行分类是光谱分析的首要任务,同时离群光谱的发现有可能对稀有天体的研究提供很大的帮助。
[0003]现今已经有很多优秀的光谱分类、异常光谱寻找的方法,这些方法为大量光谱的分类提供了很大帮助,但是为了严谨考虑,部分稀有类别光谱的最终结果确定仍需要由天文学家根据经验去判定,而这些方法在需要人工干预的环节缺乏自动化,往往是手动筛选并观察,会浪费较多的精力。自动可视化分析工作在天文光谱领域是缺失的,提高天文学家观察并分析光谱的自动化程度,减少繁琐的人工操作,进而提高光谱分析效率,是一个亟待解决的问题。

技术实现思路

[0004]本专利技术为了克服现有技术中存在的不足,所要解决的技术问题为:提供一种面向天体光谱数据的自动可视化分析方法的改进。
[0005]为了解决上述技术问题,本专利技术采用的技术方案为:一种面向天体光谱数据的自动可视化分析方法,包括如下步骤:S1:获取光谱数据并预处理;S2:利用SP

tSNE降维算法将预处理后的光谱数据降至二维,所述SP

tSNE降维算法的步骤为:首先用对比学习模型提取光谱的特征表示,训练时的正样本是一条光谱的增强,包括加随机噪声、加随机异常发射/吸收线、随机左右平移1

5个像素,负样本为其他光谱的增强,最终训练成256维的特征向量,之后对256维的特征向量进行t

SNE降维;S3:构建交互式二维平面,然后将降维后的数据映射至交互式二维平面实现可视化;S4:利用鼠标对交互式二维平面上的点进行框选,系统会在光谱子窗口中自动展示出框选区域中的点对应光谱的均值谱。
[0006]还包括S5:在框选出感兴趣的光谱之后,根据需要在光谱上标注出发射线和吸收线,同时能够自定义发射线和吸收线的候选线,并且线的位置能够通过调整红移大小进行调整,最后在交互式二维平面上展示框选光谱的平均物理参数。
[0007]还包括S6:对框选中的区域中点的光谱进行保存。
[0008]所述步骤S1中的获取的光谱数据来源于光谱数据库,所述光谱数据库包括fits文件形式的原始光谱或经过处理后的csv文件形式的光谱数据,对光谱数据通过正则化进行
预处理。
[0009]所述步骤S4中利用鼠标在交互式平面上进行的交互,是利用Python中Matplotlib画图库中提供的画矩形功能进行区域框选,然后通过框选的坐标找到矩形中的点,具体步骤如下:S4.1:系统实时监听鼠标动作,在用鼠标框选时,系统记录下鼠标按下和松开的坐标(

1,

1)、(

2,

2),并传递给回调函数;S4.2:回调函数找出坐标位于框选矩形内的点的索引,即
푚푖푛
(

1,

2)≤


푚푎푥
(

1,

2)且
푚푖푛
(

1,

2)≤


푚푎푥
(

1,

2);S4.3:通过步骤S4.2得到的索引找出对应的光谱,取平均后在子窗口中进行展示。
[0010]所述均值谱的物理参数包括表面重力、表面温度、铁元素和氢元素丰度比、视向速度,物理参数利用Lamost提供的数据处理pipeline计算得到。
[0011]多个框选区域所画出的光谱所在的子窗口互不干扰,在交互式二维平面上能够同时画出多个区域的光谱进行比较,同时主窗口上有关闭全部光谱子窗口的按钮。
[0012]一种面向天体光谱数据的自动可视化分析系统,包括光谱数据库、处理模块、交互式二维平面、鼠标,其中处理模块与光谱数据库、交互式二维平面、鼠标相连,所述处理模块将光谱数据库内的光谱数据通过SP

tSNE降维算法降维后投影在交互式二维平面上,通过操作鼠标对交互式二维平面上的光谱的点进行框选,交互式二维平面上自动显示出此区域内的点对应光谱的均值谱,进而通过交互式二维平面实现对光谱数据的聚类、离群分析。
[0013]本专利技术相对于现有技术具备的有益效果为:1、优化了直接用一维光谱进行t

SNE降维时所用的欧氏距离会受噪声干扰的问题。
[0014]2、提出交互式平面,在光谱降维、映射到交互式平面之后,可以利用鼠标对平面上的点进行框选,系统会自动展示出框选区域内的点对应光谱的均值谱,减少了光谱分类、离群天体寻找所需要手动筛选、画图分析等繁琐操作。
[0015]3、可以根据选择在画出的光谱上标注出发射线、吸收线,还可以显示出光谱的物理参数,便于天文从业者对光谱进行分析。
[0016]4、可以对降维结果进行保存,便于后续分析,同时能省去下次分析时降维所花费的时间,还能对框选区域的光谱进行保存,便于二次聚类或分析。
附图说明
[0017]下面结合附图对本专利技术做进一步说明。
[0018]图1为本专利技术自动可视化分析方法的流程图。
[0019]图2为本专利技术自动可视化分析系统的初始界面图。
[0020]图3为本专利技术自动可视化分析系统对高维光谱降维投影后的效果图。
[0021]图4为本专利技术自动可视化分析系统在交互式二维平面上进行区域框选和系统展示出的光谱图。
[0022]图5为本专利技术自动可视化分析系统保存框选区域所有光谱的操作图。
[0023]图6为本专利技术自动可视化分析方法的数据流向图。
具体实施方式
[0024]如图1至图6所示,本专利技术提供了一种面向光谱数据的自动可视化分析方法,包括以下步骤:S1:获取光谱数据并做正则化处理;S2:利用SP

tSNE降维算法将预处理后的光谱数据降至二维;S3:构建交互式平面,将二维数据映射在交互式二维平面上,呈现给用户,其中相似的光谱数据在平面上的距离近,不相似的距离远;S4:用户利用鼠标对交互式二维平面上的点进行框选,系统会自动显示出此区域内的点对应光谱的均值谱以便用户分析。
[0025]S5:用户可以根据需要在光谱上标注出发射线、吸收线,并且可以通过调整红移大小调整线的位置,同时系统提供所展示光谱的平均物理参数。
[0026]S6:系统提供对框选区域中点的光谱进行保存的功能,方便对其进行二次聚类或分析。
[0027]本专利技术的方法首先获取光谱数据并预处理:用户可以根据系统提本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向天体光谱数据的自动可视化分析方法,其特征在于:包括如下步骤:S1:获取光谱数据并预处理;S2:利用SP

tSNE降维算法将预处理后的光谱数据降至二维,所述SP

tSNE降维算法的步骤为:首先用SimCLR对比学习模型提取光谱的特征表示,训练时的正样本是一条光谱的增强,包括加随机噪声、加随机异常发射/吸收线、随机左右平移1

5个像素,负样本为其他光谱的增强,最终训练成256维的特征向量,之后对256维的特征向量进行t

SNE降维;S3:构建交互式二维平面,然后将降维后的数据映射至交互式二维平面实现可视化;S4:利用鼠标对交互式二维平面上的点进行框选,系统会在光谱子窗口中自动展示出框选区域中的点对应光谱的均值谱。2.根据权利要求1所述的一种面向天体光谱数据的自动可视化分析方法,其特征在于:还包括S5:在框选出感兴趣的光谱之后,根据需要在光谱上标注出发射线和吸收线,同时能够自定义发射线和吸收线的候选线,并且线的位置能够通过调整红移大小进行调整,最后在交互式二维平面上展示框选光谱的平均物理参数。3.根据权利要求2所述的一种面向天体光谱数据的自动可视化分析方法,其特征在于:还包括S6:对框选中的区域中点的光谱进行保存。4.根据权利要求1

3任一项所述的一种面向天体光谱数据的自动可视化分析方法,其特征在于:所述步骤S1中的获取的光谱数据来源于光谱数据库,所述光谱数据库包括fits文件形式的原始光谱或经过处理后的csv文件形式的光谱数据,对光谱数据通过正则化进行预处理。5.根据权利要求1

3任一项所述的一种面向天体光谱数据的自动可视化分析方法,其特征在于:所述步骤S4中利用鼠标在交互式平面上进行的交互是利用Python中Matplotlib画图库中提供的画矩形功能进行区域框选,然后通过框选的坐标找到矩形中的点,具体步骤如下:S4.1:系统实时监听鼠标动...

【专利技术属性】
技术研发人员:杨海峰史晨辉蔡江辉赵旭俊郑爱宇
申请(专利权)人:太原科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1