基于卷积神经网络的脉冲星候选体识别方法技术

技术编号:20655434 阅读:26 留言:0更新日期:2019-03-23 07:01
本发明专利技术公开了一种基于卷积神经网络的脉冲星候选体识别方法,主要解决现有脉冲星识别方法依靠人工耗时费力、传统的机器学习方法识别速度慢且准确率低的问题。其实现方案是:1、把巡天观测数据处理成图像并对每张图像进行二分类标记,建立脉冲星候选体和非脉冲星候选体图像的训练集合、验证集合和测试集合;2、搭建卷积神经网络模型;3、用训练集合对卷积神经网络模型进行训练并用验证集合评价模型;4、用训练好的卷积神经网络识别测试集合中的每张图像,输出每张图像的分类标记,即脉冲星候选体图像和非脉冲星候选体图像。本发明专利技术复杂度低、训练耗时少、识别速度快,识别准确率高,可用于对天文数据的处理。

【技术实现步骤摘要】
基于卷积神经网络的脉冲星候选体识别方法
本专利技术属于图像处理
,特别涉及是一种脉冲星候选体识别方法,可用于对天文数据的处理。
技术介绍
随着科学技术的进步,射电望远镜具有更高的时间和频率分辨率,观测到的脉冲星数据量呈现爆炸增长趋势。如何有效快速的在海量的脉冲星观测数据中识别脉冲星候选体,是天文机构需要解决的问题。目前在脉冲星观测数据中识别脉冲星候选体主要有两种方法:第一种方法是把观测数据处理成图像,人工逐张浏览图像,把脉冲星候选体识别出来。第二种方法是把观测数据处理成图像,然后对图像进行预处理,放入训练好的机器学习模型中,对图像进行识别分类。对于以上两种方法,第一种方法采用人工的方法识别,耗时费工,效率很低。第二种方法采用机器学习的方法识别,训练模型很费时,前期需要对要筛选的数据做预处理,模型识别准确率不高。随着脉冲星巡天观测设备性能的不断提高,脉冲星巡天观测数据越来越多,现有的方法已经无法满足在海量观测数据中识别脉冲星候选体的要求。
技术实现思路
本专利技术的目的在于针对上述现有技术的不足,提出一种基于卷积神经网络的脉冲星候选体识别方法,以在海量脉冲星巡天观测数据中快速、准确的识别出脉冲星候选体。为实现上述目的,本专利技术的技术方案包括如下:(1)构建三种数据集:1.1)从脉冲星巡天观测数据中,利用澳大利亚国家天文台CSIRO的开源软件tempo2生成M张图像,计算每张图像的相对强度h:1.2)设置相对强度阈值ε,将每张图像的相对强度h与相对强度阈值ε进行比较:如果h大于ε,则将图像的理想标签值设置为1,反之设置为0,并令1代表脉冲星候选体图像,0代表是非脉冲星候选体图像;1.3)根据1.2)的结果,将M张图像用集合C表示为:C={(X1,y1),(X2,y2),...,(Xm,ym),...,(XM,yM)},其中Xm代表第m张图像,ym代表第m张图像的标签值,m=1,2,...,M;1.4)在集合C中随机选取E个元素作为训练集合T,再从集合C剩余部分选取R个元素作为验证集合D,再把剩余的N个元素作为测试集J,其中E+R+N=M;(2)在Google开源的深度学习框架tensorflow上搭建一个具有输入层、两个卷积池化层、两个全连接层及一个输出层的卷积神经网络模型;(3)将卷积神经网络模型的两个卷积池化层、两个全连接层和输出层的可学习参数均用截断正态分布进行初始化;(4)使用训练集合T对(2)搭建的卷积神经网络模型进行训练,得到训练好的卷积神经网络模型;(5)对训练好的卷积神经网络模型进行评价,选出脉冲星候选体的识别模型:5.1)把验证集合D中的图像依次输入到(4)中训练好的模型中,得到验证集合D的每张图像的实际标签值:5.2)根据每张图像实际标签值和1.3)得到的理想标签值,计算验证集合的准确率accu验,并将计算验证集合的准确率accu验与设定的准确率阈值ε验进行比较:若accu验≥ε验,则将当前模型作为脉冲星候选体的识别模型,执行(6),否则,返回(3)继续训练模型;(6)把测试集合J中的图像依次输入脉冲星候选体的识别模型中,得到测试集合J的每张图像的实际标签值:若实际标签值为1,则为是脉冲星候选体图像,否则,为是非脉冲星候选体图像。本专利技术与现有技术相比具有以下优点:1、本专利技术的卷积神经网络采用两层卷积池化层,相比机器学习方法,能提取脉冲星图像的抽象特征,提高了脉冲星图像的识别准确率。2.本专利技术采用的卷积神经网络,相比机器学习方法,可学习参数少、模型复杂度低,减少了网络的训练时间,提高了识别海量脉冲星巡天观测数据的速度。3.本专利技术由于在两个卷积池化层采用卷积操作对脉冲星图像提取有用特征,相比机器学习方法,避免了对脉冲星图像进行图像预处理操作,简化了提取有用信息的操作,进一步提高了识别海量脉冲星巡天观测数据的速度。附图说明图1为本专利技术的实现总流程图;图2本专利技术中构建的卷积神经网络模型图;图3为本专利技术中对卷积神经网络模型进行训练的子流程图。具体实施方式以下参照附图对本专利技术作进一步详细描述。参照图1,本专利技术的实现步骤如下:步骤1.构建三种数据集1a)利用软件tempo2处理10万条脉冲星巡天观测数据,生成10万张大小为208×208的图像;1b)计算每张图像的相对强度h,按如下公式计算:其中,λ为图像的峰值强度,为图像的平均强度;1c)设置相对强度阈值ε=2,将每张图像的相对强度h与相对强度阈值ε进行比较,为每张图像贴上理想标签值,如果h大于ε,则将图像的理想标签值设置为1,反之设置为0,并令1代表脉冲星候选体图像,0代表是非脉冲星候选体图像;1d)把10万张带有标签的图像组成数据集合,从数据集合中选取1000张脉冲星候选体图像和1000张非脉冲星候选体图像组成本实例所用的集合C:C={(X1,y1),(X2,y2),...,(Xm,ym),...,(X2000,y2000)}其中Xm代表第m张图像,ym代表第m张图像的标签值,m=1,2,...,2000;1e)从集合C中选取700张脉冲星候选体图像、700张非脉冲星候选体图像组成训练集合T,再从集合C剩余部分选取150张脉冲星候选体图像、150张非脉冲星候选体图像组成验证集合D,再用最后剩余的300张图像组成测试集合J。本专利技术中训练集合、验证集合、测试集合中图像张数不限于本实例所用的张数。步骤2.搭建卷积神经网络模型。在深度学习库tensorflow上搭建一个具有输入层、两个卷积池化层、两个全连接层及一个输出层的卷积神经网络模型,其结构关系如图2所示,各层参数如下:输入层:由35×208×208的矩阵构成,其中35表示每次往卷积神经网络中输入图像的数目,两个208分别表示输入图像的宽、高;第一卷积层:由16个可学习卷积核、16个可学习偏置和一个Relu激活函数构成,每个可学习卷积核是宽度为5、高度为5、通道为3的5×5×3的矩阵,16个可学习偏置组成16×1的矩阵,每个卷积核的移动步长为1;第一池化层:由一个Max-pooling池化函数构成,Max-pooling池化函数是宽度为2、高度为2的2×2的矩阵,Max-pooling池化函数的移动步长为2;第二卷积层:由16个可学习卷积核、16个可学习偏置和一个Relu激活函数构成,每个可学习卷积核是宽度为5、高度为5、通道为16的5×5×16的矩阵,16个可学习偏置组成16×1的矩阵,每个卷积核的移动步长为1;第二池化层:由一个Max-pooling池化函数构成,该Max-pooling池化函数是宽度为2、高度为2的2×2的矩阵,Max-pooling池化函数的移动步长为1;第一全连接层:由一个可学习权重矩阵、一个可学习偏置和一个Relu激活函数构成,其可学习权重为128×173056的矩阵,可学习偏置为128×1的矩阵;第二全连接层:由一个可学习权重矩阵、一个可学习偏置和一个Relu激活函数构成,其可学习权重为128×128的矩阵,可学习偏置为128×1的矩阵;输出层:由一个可学习权重矩阵、一个可学习偏置和一个SoftMax激活函数构成,其可学习权重为2×128的矩阵,可学习偏置为2×1的矩阵。输入层的每张图像依次作为第一个卷积池化层的输入量,第一个卷积层的输出量经过Relu激活函数后本文档来自技高网...

【技术保护点】
1.一种基于卷积神经网络的脉冲星候选体识别方法,其特征在于,包括如下:(1)构建三种数据集:1.1)从脉冲星巡天观测数据中,利用联邦科学与工业研究组织CSIRO的开源软件tempo2生成M张图像,计算每张图像的相对强度h:1.2)设置相对强度阈值ε,将每张图像的相对强度h与相对强度阈值ε进行比较:如果h大于ε,则将图像的理想标签值设置为1,反之设置为0,并令1代表脉冲星候选体图像,0代表是非脉冲星候选体图像;1.3)根据1.2)的结果,将M张图像用集合C表示为:C={(X1,y1),(X2,y2),...,(Xm,ym),...,(XM,yM)},其中Xm代表第m张图像,ym代表第m张图像的标签值,m=1,2,...,M;1.4)在集合C中随机选取E个元素作为训练集合T,再从集合C剩余部分选取R个元素作为验证集合D,再把剩余的N个元素作为测试集J,其中E+R+N=M;(2)在Google开源的深度学习框架tensorflow上搭建一个具有输入层、两个卷积池化层、两个全连接层及一个输出层的卷积神经网络模型;(3)将卷积神经网络模型的两个卷积池化层、两个全连接层和输出层的可学习参数均用截断正态分布进行初始化;(4)使用训练集合T对(2)搭建的卷积神经网络模型进行训练,得到训练好的卷积神经网络模型;(5)对训练好的卷积神经网络模型进行评价,选出脉冲星候选体的识别模型:5.1)把验证集合D中的图像依次输入到(4)中训练好的模型中,得到验证集合D的每张图像的实际标签值:5.2)根据每张图像实际标签值和1.3)得到的理想标签值,计算验证集合的准确率accu验,并将计算验证集合的准确率accu验与设定的准确率阈值ε验进行比较:若accu验≥ε验,则将当前模型作为脉冲星候选体的识别模型,执行(6),否则,返回(3)继续训练模型;(6)把测试集合J中的图像依次输入脉冲星候选体的识别模型中,得到测试集合J的每张图像的实际标签值:若实际标签值为1,则为是脉冲星候选体图像,否则,为是非脉冲星候选体图像。...

【技术特征摘要】
1.一种基于卷积神经网络的脉冲星候选体识别方法,其特征在于,包括如下:(1)构建三种数据集:1.1)从脉冲星巡天观测数据中,利用联邦科学与工业研究组织CSIRO的开源软件tempo2生成M张图像,计算每张图像的相对强度h:1.2)设置相对强度阈值ε,将每张图像的相对强度h与相对强度阈值ε进行比较:如果h大于ε,则将图像的理想标签值设置为1,反之设置为0,并令1代表脉冲星候选体图像,0代表是非脉冲星候选体图像;1.3)根据1.2)的结果,将M张图像用集合C表示为:C={(X1,y1),(X2,y2),...,(Xm,ym),...,(XM,yM)},其中Xm代表第m张图像,ym代表第m张图像的标签值,m=1,2,...,M;1.4)在集合C中随机选取E个元素作为训练集合T,再从集合C剩余部分选取R个元素作为验证集合D,再把剩余的N个元素作为测试集J,其中E+R+N=M;(2)在Google开源的深度学习框架tensorflow上搭建一个具有输入层、两个卷积池化层、两个全连接层及一个输出层的卷积神经网络模型;(3)将卷积神经网络模型的两个卷积池化层、两个全连接层和输出层的可学习参数均用截断正态分布进行初始化;(4)使用训练集合T对(2)搭建的卷积神经网络模型进行训练,得到训练好的卷积神经网络模型;(5)对训练好的卷积神经网络模型进行评价,选出脉冲星候选体的识别模型:5.1)把验证集合D中的图像依次输入到(4)中训练好的模型中,得到验证集合D的每张图像的实际标签值:5.2)根据每张图像实际标签值和1.3)得到的理想标签值,计算验证集合的准确率accu验,并将计算验证集合的准确率accu验与设定的准确率阈值ε验进行比较:若accu验≥ε验,则将当前模型作为脉冲星候选体的识别模型,执行(6),否则,返回(3)继续训练模型;(6)把测试集合J中的图像依次输入脉冲星候选体的识别模型中,得到测试集合J的每张图像的实际标签值:若实际标签值为1,则为是脉冲星候选体图像,否则,为是非脉冲星候选体图像。2.根据权利要求1所述方法,其特征在于,步骤1.1)中计算图像的相对强度,按如下公式计算:其中,λ为图像的峰值强度,为图像的平均强度。3.根据权利要求1所述的方法,其特征在于,步骤(2)中搭建的卷积神经网络模型,各层结构如下:输入层:由集合Q:{(Z1,g1),...,(Zi,gi),...,(ZB,gB)}中的{Z1,...,Zi,...,ZB}构成,其中,Zi代表集合Q中的第i张图像,gi代表集合Q中的第i张图像的标签值,i=1,2,...,B,B为任意大于1的整数;两个卷积池化层:均由K个可学习的卷积核、K个可学习的偏置、一个Relu激活函数和一个Max-pooling池化函数构成,K为大于等于1的整数;两个全连接层:均由一个可学习的权重矩阵、一个可学习的偏置和一个Relu激活函数构成;输出层:由...

【专利技术属性】
技术研发人员:方海燕刘陈辉孙海峰李小平苏剑宇张力丛少鹏曹阳陆鹏杰张学健
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1