基于模式识别法的行星状星云光谱挖掘方法及系统技术方案

技术编号:11704784 阅读:93 留言:0更新日期:2015-07-09 04:23
本发明专利技术涉及天文数据挖掘技术领域,具体的说是一种能够自动识别天文光谱数据并对其进行挖掘,从而完成基于模式识别法的行星状星云光谱挖掘方法及系统,其特征在于包括:针对大型光谱巡天望远镜的fits格式数据进行数据预处理;预处理需依次进行统一波长、去低信噪比数据、流量归一化;使用降维方法(PCA)对预处理后的高维数据进行降维处理;构造分类器(SVM),在维度较低的投影空间,对海量的待分类数据进行处理;数据核对,获得挖掘结果,本发明专利技术通过对海量光谱进行处理,共发现了140个行星状星云,通过交叉证认,其中3个是未被收录的新的源,验证了算法的有效性,为在海量光谱中快速发现PNe提供了可行的途径,具有处理速度快、分析准确等显著的优点。

【技术实现步骤摘要】

本专利技术涉及天文数据挖掘
,具体的说是一种能够自动识别天文光谱数 据并对其进行挖掘,从而完成基于模式识别法的行星状星云光谱挖掘方法及系统
技术介绍
行星状星云(planetarynebula-PNe)是一种非常特殊和稀少的天体,是由某些 类型的恒星在生命末期处于渐近巨星分支阶段时抛射出的离子态气体组成膨胀、发光外壳 形成的一种发射星云。 现有的PNe发现方式主要依靠模板匹配或者颜色筛选等人工识别方法,例 如:Warren在《WarrenA.ReidandQuentinA. 2010,Parker.MNRAS,405 (2): 1349-1374.》中基于图像数据来识别发射线天体,发现了 460个新的PNe。Kniazev于 《KniazevAlexeiY,GrebelEvaK,ZuckerDanielB,etal. 2005,AIPC. 804. 15K》通过 测光筛选,发现了 130 个新的PNe。Jacoby于《GeorgeH.Jacoby,MatthiasKronberger, DanaPatchick,etal. 2010,PASA.27.156J》通过交叉等方法发现了 100 个以上的PNe。 然而这些方法耗都需要耗费较多的人工处理时间,不适合在海量的光谱数据中准确、快速 发现目标天体。
技术实现思路
本专利技术针对现有技术的缺点和不足,提出了能够自动识别海量天文光谱数据并 对其进行挖掘,从而完成基于模式识别法的行星状星云光谱挖掘方法及系统。 本专利技术可以通过以下措施达到: 一种基于模式识别法的行星状星云光谱挖掘方法,其特征在于包括以下步骤: 步骤1 :本方法针对大型光谱巡天望远镜的fits格式数据进行数据预处理;预处理 需依次进行统一波长、去低信噪比数据、流量归一化; 步骤2 :使用降维方法(PCA)对预处理后的高维数据进行降维处理; 步骤3 :构造分类器(SVM),在维度较低的投影空间,对海量的待分类数据进行处理; 步骤4 :数据核对,获得挖掘结果。 本专利技术步骤2中PCA降维方法中参数取值范围的确定用公式(1)实现,计算方差 贡献率|1,结果见图2,PCA维数确定为43维:【主权项】1. 一种基于模式识别法的行星状星云光谱挖掘方法,其特征在于包括以下步骤: 步骤1 :本方法针对SDSS和LAMOST等大型光谱巡天望远镜的fits格式数据进行数据 预处理;预处理主要包括统一波长、去低信噪比数据、流量归一化; 步骤2 :使用降维方法(PCA)对预处理后的高维数据进行降维处理; 步骤3 :构造分类器(SVM),在维度较低的投影空间,对海量的待分类数据进行处理; 步骤4 :数据核对,获得挖掘结果。2. 根据权利要求1所述的一种基于模式识别法的行星状星云光谱挖掘方法,其特征在 于所述步骤2中PCA降维方法中参数取值范围的确定用公式(1)实现,计算方差贡献率μ, PCA维数确定为43维:其中靡3光谱的采样点,一般为4000, 为特征值。3. 根据权利要求1所述的一种基于模式识别法的行星状星云光谱挖掘方法,其特征 在于步骤3中对于SVM的两个参数通过网格搜索来确定:C和σ,限定范围:C = ; 〇= ,通过网格搜索的方法最 终确定 C=48. 5029,σ=16。4. 一种基于模式识别法的行星状星云光谱挖掘的系统,其特征在于设有用于对获取 的数据进行预处理的数据预处理单元;用于对预处理后的数据进行特征提取的数据特征提 取单元;用于对数据进行降维处理的采样投影单元;用于对降维处理后的数据进行分类的 SVW分类单元;用于对分类单元输出的结果进行核对的数据核对单元以及用于输出挖掘结 果的显示输出单元。【专利摘要】本专利技术涉及天文数据挖掘
,具体的说是一种能够自动识别天文光谱数据并对其进行挖掘,从而完成基于模式识别法的行星状星云光谱挖掘方法及系统,其特征在于包括:针对大型光谱巡天望远镜的fits格式数据进行数据预处理;预处理需依次进行统一波长、去低信噪比数据、流量归一化;使用降维方法(PCA)对预处理后的高维数据进行降维处理;构造分类器(SVM),在维度较低的投影空间,对海量的待分类数据进行处理;数据核对,获得挖掘结果,本专利技术通过对海量光谱进行处理,共发现了140个行星状星云,通过交叉证认,其中3个是未被收录的新的源,验证了算法的有效性,为在海量光谱中快速发现PNe提供了可行的途径,具有处理速度快、分析准确等显著的优点。【IPC分类】G06K9-62, G06F17-30【公开号】CN104765832【申请号】CN201510174063【专利技术人】姜斌 【申请人】山东大学(威海)【公开日】2015年7月8日【申请日】2015年4月14日本文档来自技高网
...

【技术保护点】
一种基于模式识别法的行星状星云光谱挖掘方法,其特征在于包括以下步骤:步骤1:本方法针对SDSS和LAMOST等大型光谱巡天望远镜的fits格式数据进行数据预处理;预处理主要包括统一波长、去低信噪比数据、流量归一化;步骤2:使用降维方法(PCA)对预处理后的高维数据进行降维处理;步骤3:构造分类器(SVM),在维度较低的投影空间,对海量的待分类数据进行处理;步骤4:数据核对,获得挖掘结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:姜斌
申请(专利权)人:山东大学威海
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1