当前位置: 首页 > 专利查询>蔡尔谦专利>正文

一种基于深度学习的星系分类与识别的方法及装置制造方法及图纸

技术编号:23853720 阅读:27 留言:0更新日期:2020-04-18 09:58
一种基于深度学习的星系分类与识别的方法和装置,其可以实现对星系形态的自动快速精准预测,从而能够对含有大量星系的图像进行快速处理。这种基于深度学习的星系分类与识别的方法,包括:(1)获取带有训练结果标签的天文数据;(2)对数据进行预处理;(3)利用卷积神经网络搭建星系图像分类神经网络;(4)对星系图像分类神经网络进行训练及测试;(5)利用计算机视觉算法检测单张图像中的多个星系。

A method and device of Galaxy classification and recognition based on deep learning

【技术实现步骤摘要】
一种基于深度学习的星系分类与识别的方法及装置
本专利技术涉及天文数据处理的
,尤其涉及一种基于深度学习的星系分类与识别的方法,以及基于深度学习的星系分类与识别的装置。
技术介绍
了解人类、地球、太阳系、银河系,直至这个宇宙为什么会形成以及如何形成的,是人类面临的基本问题。此问题的部分答案在于星系(例如银河系)的起源。星系的形成与演化、恒星物理、宇宙的起源是现代天体物理学的基本研究方向。然而,关于银河系(或宇宙中其他约1000亿个星系中的任何一个)是如何形成并演化的问题仍然存在。可以通过研究星系的结构随红移的演化了解宇宙早期的原初物质是怎样在引力的作用下逐渐塌缩形成原初星系的。通过了解高红移星系是经过怎样的过程演变为现在能够观测到的各类星系,可以了解星系的形成和演化过程。在对自然现象(包括社会现象)的本质做出深入了解之前,先对大量观测调查数据进行统计分类,从中发现某些具有启示意义的规律性,这是许多研究工作者常采用的办法。元素周期表的发现就是这样一个成功的例子。恒星光谱的分类也是如此,尽管在开始这项工作时人们并不了解恒星的真实结构和演化,但后来的研究表明,恒星的光谱分类是揭示恒星奥秘的先驱性工作,它也是发现赫罗图的基础,而赫罗图在恒星物理的研究中起着举足轻重的作用。同样地,星系形态与星系的形成和演化有着密切的联系,因此星系形态分类(galaxymorphologyclassification)成为研究不同星系物理特征的重要过程之一。星系形态分类首先能为数据分析或观测项目制作大型数据库目录,其次可以发现背后的基础物理原理。目前了解星系最直接的手段之一就是其形态,星系有各种形状,大小和颜色:从美丽的螺旋形到巨大的椭圆形。了解星系的分布,位置和类型与形状,大小和颜色之间的联系,是解决这个难题的关键因素。图像是天文学的核心要素之一。天文望远镜捕获来自遥远外太空的光源发出的光子,形成图像或光谱,以供天文学家们进行分析研究,天文学家希望解码这些图像中可用的信息,以揭示宇宙的根本奥秘。近几十年来,随着现代工程技术的发展进步,人们建造了大量的地基、天基以及不同波段范围的天文望远镜。天文图像数据急剧增多,现代一般的积分视场单元(integralfieldunits,IFU)每晚会生成60GB的数据,一般的成像仪器每晚会生成300GB的数据,将要建成的LSST每晚将会产生20TB的数据,将会探测超过2千万个星系。星系图像的分类工作中,哈勃于1926年提出的分类方式被广泛采纳,当时利用目视方法,哈勃根据星系的形态将星系简单分为椭圆、漩涡和不规则星系。人们通过视觉检查确定物体的形态,部分原因是没有算法比人眼更好地完成这一任务。随着时间的推移和观测技术的进步,地面和空间上的望远镜捕获了越来越多的遥远星系图像。随着越来越大的望远镜继续收集这些图像,开展了一些大天区星系图像巡天计划如SDSS(SloanDigitalSkVSurvey)。数据集的大小开始爆炸式增长,仅凭视觉检查就不可能完成这项耗时的工作。必须开展新的星系分类方法,利用计算机和算法来完成这一任务。比如,Staiano,A.等在2005年提出了一种非线性隐参数数学模型并用于多维度星系数据挖掘,如对多维度的可视化,聚类和分类;严太生等在2010年研究了聚类算法在天文学中的应用;2011年研究人员将机器学习算法应用于处理多光谱,宽视场图像解决不同的天文目标分类问题;Franco-Arcega,A.等在2013年探索了决策树算法在天文目标分类问题中的应用;近5年,得益于计算机算力的增强、数据的积累和深度学习算法的应用,人们在图像分类方面达到了前所未有的准确率。这有助于天文学家处理大量星系数据。但是,这些研究都注重于如何识别,而并未向其他相关研究人员提供可用且易用的分类程序。目前的星系分类神经网络可以进行分类,但使用这些程序都是很复杂的,而且这些程序也只能对单个星系进行识别,而星系数据集大多数是如哈勃深场一样多个星系的光学数据。
技术实现思路
为克服现有技术的缺陷,本专利技术要解决的技术问题是提供了一种基于深度学习的星系分类与识别的方法,其可以实现对星系形态的自动快速精准预测,从而能够对含有大量星系的图像进行快速处理。本专利技术的技术方案是:这种基于深度学习的星系分类与识别的方法,其包括以下步骤:(1)获取带有训练结果标签的天文数据;(2)对数据进行预处理;(3)利用卷积神经网络搭建星系图像分类神经网络;(4)对星系图像分类神经网络进行训练及测试;(5)利用计算机视觉算法检测单张图像中的多个星系。本专利技术整合星系识别、分类、批处理、模型更换等功能采用计算机科学领域最新研究成果,通过搭建和训练进行图像分类的卷积神经网络,实现对星系形态的自动快速精准预测;传统星系图像分类方法不能对单张图像中的多个星系进行识别统计,本专利技术结合计算机视觉算法,能够对含有大量星系的图像进行快速处理。还提供了一种基于深度学习的星系分类与识别的装置,其包括:数据采集模块,其配置来获取带有训练结果标签的天文数据;数据预处理模块,其配置来对数据进行预处理;神经网络搭建模块,其配置来利用卷积神经网络搭建星系图像分类神经网络;神经网络训练及测试模块,其配置来对星系图像分类神经网络进行训练及测试;星系检测模块,其配置来利用计算机视觉算法检测单张图像中的多个星系。附图说明图1是根据本专利技术的基于深度学习的星系分类与识别的方法的流程图。图2示出了根据本专利技术的基于深度学习的星系分类与识别的方法的神经网络搭建。图3示出了训练过程中损失的变化趋势。图4示出了训练过程中准确率的变化趋势。具体实施方式如图1所示,这种基于深度学习的星系分类与识别的方法,其包括以下步骤:(1)获取带有训练结果标签的天文数据;(2)对数据进行预处理;(3)利用卷积神经网络搭建星系图像分类神经网络;(4)对星系图像分类神经网络进行训练及测试;(5)利用计算机视觉算法检测单张图像中的多个星系。本专利技术整合星系识别、分类、批处理、模型更换等功能采用计算机科学领域最新研究成果,通过搭建和训练进行图像分类的卷积神经网络,实现对星系形态的自动快速精准预测;传统星系图像分类方法不能对单张图像中的多个星系进行识别统计,本专利技术结合计算机视觉算法,能够对含有大量星系的图像进行快速处理,如哈勃深场巡天(HubbleUltraDeepField)。优选地,该方法还包括步骤(6),功能整理:单星系图像识别、多星系图像识别、批处理星系图像、更换模型。优选地,该方法还包括步骤(7),对通过步骤(1)-(6)获得的星系图像分类系统进行图形用户界面GUI设计。优选地,所述步骤(1)采用的天文数据来自星际动物园2在Kaggle平台上发起的比赛GalaxyZoo-TheGalaxyChallenge,该数据集是专门为机器学习设计好的,其中有清晰且大小合适的本文档来自技高网
...

【技术保护点】
1.基于深度学习的星系分类与识别的方法,其特征在于:其包括以下步骤:/n(1)获取带有训练结果标签的天文数据;/n(2)对数据进行预处理;/n(3)利用卷积神经网络搭建星系图像分类神经网络;/n(4)对星系图像分类神经网络进行训练及测试;/n(5)利用计算机视觉算法检测单张图像中的多个星系。/n

【技术特征摘要】
1.基于深度学习的星系分类与识别的方法,其特征在于:其包括以下步骤:
(1)获取带有训练结果标签的天文数据;
(2)对数据进行预处理;
(3)利用卷积神经网络搭建星系图像分类神经网络;
(4)对星系图像分类神经网络进行训练及测试;
(5)利用计算机视觉算法检测单张图像中的多个星系。


2.根据权利要求1所述的基于深度学习的星系分类与识别的方法,其特征在于:该方法还包括步骤(6),功能整理:单星系图像识别、多星系图像识别、批处理星系图像、更换模型。


3.根据权利要求2所述的基于深度学习的星系分类与识别的方法,其特征在于:该方法还包括步骤(7),对通过步骤(1)-(6)获得的星系图像分类系统进行图形用户界面GUI设计。


4.根据权利要求3所述的基于深度学习的星系分类与识别的方法,其特征在于:所述步骤(1)采用的天文数据来自星际动物园2在Kaggle平台上发起的比赛GalaxyZoo-TheGalaxyChallenge,该数据集是专门为机器学习设计好的,其中有清晰且大小合适的数据与相应训练结果标签;Kaggle数据集包含来自SDSSDR7的61579张图像,且每张图像都拥有可信的判断标签,该标签标示了志愿者们对11个问题的37中可能的回答,标签的产生方法是通过计算每个答案回答为真所占总回答人数的比例而产生的大于0小于1的浮点数,标签被以csV格式存储而图像被以jpg格式存储。


5.根据权利要求4所述的基于深度学习的星系分类与识别的方法,其特征在于:所述步骤(2),决策树将星系分为:圆形星系,中间星系,雪茄状星系,侧向星系,漩涡星系;按照下表的标准来筛选这5类图片,



其中,T01-T011分别对应GalaxyZoo决策树中的十一个问题,fsmooth代表一张图片被评定为平滑星系的概率,以此类推inbetween为中间星系,cigar-shaped为雪茄星系,features/disk为碟状星系,edgeon为侧向星系,spiral为漩涡星系。


6.根据权利要求5所述的基于深度学习的星系分类与识别的方法,其特征在于:所述步骤(3)中,设计一个共6个卷积层的深层卷积神经网络,然后经过1个Flatten层将FeatureMaps向量化,再经过两个全连接层将输出转至一个5维的向量,最后经过softmax激活函数得到对输入图像类别的预测结果,
神经网络的结构为:
第1层conv1:接收3通道RGB彩色图像的输入,与16个卷积核卷积并经过relu激活函数和2x2最大池化操作后,输出大小为64x64x16
第2层conv2:接收来自conv1的输出,与32个卷积核卷积并经过relu激活函数和2x2最大池化操作后,输出大小为32x32x32
第3层conv3:接收来自conv2的输出,与6...

【专利技术属性】
技术研发人员:蔡尔谦
申请(专利权)人:蔡尔谦
类型:发明
国别省市:北京;11

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1