基于卷积神经网络的脉冲星候选体识别方法技术

技术编号：20655434 阅读：26 留言：0更新日期：2019-03-23 07:01

本发明专利技术公开了一种基于卷积神经网络的脉冲星候选体识别方法，主要解决现有脉冲星识别方法依靠人工耗时费力、传统的机器学习方法识别速度慢且准确率低的问题。其实现方案是：1、把巡天观测数据处理成图像并对每张图像进行二分类标记，建立脉冲星候选体和非脉冲星候选体图像的训练集合、验证集合和测试集合；2、搭建卷积神经网络模型；3、用训练集合对卷积神经网络模型进行训练并用验证集合评价模型；4、用训练好的卷积神经网络识别测试集合中的每张图像，输出每张图像的分类标记，即脉冲星候选体图像和非脉冲星候选体图像。本发明专利技术复杂度低、训练耗时少、识别速度快，识别准确率高，可用于对天文数据的处理。

全部详细技术资料下载

【技术实现步骤摘要】
基于卷积神经网络的脉冲星候选体识别方法
本专利技术属于图像处理
，特别涉及是一种脉冲星候选体识别方法，可用于对天文数据的处理。
技术介绍
随着科学技术的进步，射电望远镜具有更高的时间和频率分辨率，观测到的脉冲星数据量呈现爆炸增长趋势。如何有效快速的在海量的脉冲星观测数据中识别脉冲星候选体，是天文机构需要解决的问题。目前在脉冲星观测数据中识别脉冲星候选体主要有两种方法：第一种方法是把观测数据处理成图像，人工逐张浏览图像，把脉冲星候选体识别出来。第二种方法是把观测数据处理成图像，然后对图像进行预处理，放入训练好的机器学习模型中，对图像进行识别分类。对于以上两种方法，第一种方法采用人工的方法识别，耗时费工，效率很低。第二种方法采用机器学习的方法识别，训练模型很费时，前期需要对要筛选的数据做预处理，模型识别准确率不高。随着脉冲星巡天观测设备性能的不断提高，脉冲星巡天观测数据越来越多，现有的方法已经无法满足在海量观测数据中识别脉冲星候选体的要求。
技术实现思路
本专利技术的目的在于针对上述现有技术的不足，提出一种基于卷积神经网络的脉冲星候选体识别方法，以在海量脉冲星巡天观测数据中快速、准确的识别出脉冲星候选体。为实现上述目的，本专利技术的技术方案包括如下：(1)构建三种数据集：1.1)从脉冲星巡天观测数据中，利用澳大利亚国家天文台CSIRO的开源软件tempo2生成M张图像，计算每张图像的相对强度h：1.2)设置相对强度阈值ε，将每张图像的相对强度h与相对强度阈值ε进行比较：如果h大于ε，则将图像的理想标签值设置为1，反之设置为0，并令1代表脉冲星候选体图像，0代...

【技术保护点】
1.一种基于卷积神经网络的脉冲星候选体识别方法，其特征在于，包括如下：(1)构建三种数据集：1.1)从脉冲星巡天观测数据中，利用联邦科学与工业研究组织CSIRO的开源软件tempo2生成M张图像，计算每张图像的相对强度h：1.2)设置相对强度阈值ε，将每张图像的相对强度h与相对强度阈值ε进行比较：如果h大于ε，则将图像的理想标签值设置为1，反之设置为0，并令1代表脉冲星候选体图像，0代表是非脉冲星候选体图像；1.3)根据1.2)的结果，将M张图像用集合C表示为：C＝{(X1,y1),(X2,y2),...,(Xm,ym),...,(XM,yM)}，其中Xm代表第m张图像，ym代表第m张图像的标签值，m＝1,2,...,M；1.4)在集合C中随机选取E个元素作为训练集合T，再从集合C剩余部分选取R个元素作为验证集合D，再把剩余的N个元素作为测试集J，其中E+R+N＝M；(2)在Google开源的深度学习框架tensorflow上搭建一个具有输入层、两个卷积池化层、两个全连接层及一个输出层的卷积神经网络模型；(3)将卷积神经网络模型的两个卷积池化层、两个全连接层和输出层的可学习参数均用截断...

【技术特征摘要】
1.一种基于卷积神经网络的脉冲星候选体识别方法，其特征在于，包括如下：(1)构建三种数据集：1.1)从脉冲星巡天观测数据中，利用联邦科学与工业研究组织CSIRO的开源软件tempo2生成M张图像，计算每张图像的相对强度h：1.2)设置相对强度阈值ε，将每张图像的相对强度h与相对强度阈值ε进行比较：如果h大于ε，则将图像的理想标签值设置为1，反之设置为0，并令1代表脉冲星候选体图像，0代表是非脉冲星候选体图像；1.3)根据1.2)的结果，将M张图像用集合C表示为：C＝{(X1,y1),(X2,y2),...,(Xm,ym),...,(XM,yM)}，其中Xm代表第m张图像，ym代表第m张图像的标签值，m＝1,2,...,M；1.4)在集合C中随机选取E个元素作为训练集合T，再从集合C剩余部分选取R个元素作为验证集合D，再把剩余的N个元素作为测试集J，其中E+R+N＝M；(2)在Google开源的深度学习框架tensorflow上搭建一个具有输入层、两个卷积池化层、两个全连接层及一个输出层的卷积神经网络模型；(3)将卷积神经网络模型的两个卷积池化层、两个全连接层和输出层的可学习参数均用截断正态分布进行初始化；(4)使用训练集合T对(2)搭建的卷积神经网络模型进行训练，得到训练好的卷积神经网络模型；(5)对训练好的卷积神经网络模型进行评价，选出脉冲星候选体的识别模型：5.1)把验证集合D中的图像依次输入到(4)中训练好的模型中，得到验证集合D的每张图像的实际标签值：5.2)根据每张图像实际标签值和1.3)得到的理想标签值，计算验证集合的准确率accu验，并将计算验证集合的准确率accu验与设定的准确率阈值ε验进行比较：若accu验≥ε验，则将当前模型作为脉冲星候选体的识别模型，执行(6)，否则，返回(3)继续训练模型；(6)把测试集合J中的图像依次输入脉冲星候选体的识别模型中，得到测试集合J的每张图像的实际标签值：若实际标签值为1，则为是脉冲星候选体图像，否则，为是非脉冲星候选体图像。2.根据权利要求1所述方法，其特征在于，步骤1.1)中计算图像的相对强度，按如下公式计算：其中，λ为图像的峰值强度，为图像的平均强度。3.根据权利要求1所述的方法，其特征在于，步骤(2)中搭建的卷积神经网络模型，各层结构如下：输入层：由集合Q：{(Z1,g1),...,(Zi,gi),...,(ZB,gB)}中的{Z1,...,Zi,...,ZB}构成，其中，Zi代表集合Q中的第i张图像，gi代表集合Q中的第i张图像的标签值，i＝1,2,...,B,B为任意大于1的整数；两个卷积池化层：均由K个可学习的卷积核、K个可学习的偏置、一个Relu激活函数和一个Max-pooling池化函数构成，K为大于等于1的整数；两个全连接层：均由一个可学习的权重矩阵、一个可学习的偏置和一个Relu激活函数构成；输出层：由...

【专利技术属性】
技术研发人员：方海燕，刘陈辉，孙海峰，李小平，苏剑宇，张力，丛少鹏，曹阳，陆鹏杰，张学健，
申请(专利权)人：西安电子科技大学，
类型：发明
国别省市：陕西,61

全部详细技术资料下载我是这个专利的主人