当前位置: 首页 > 专利查询>攀枝花学院专利>正文

基于数据分布特征及模糊隶属度函数的恒星光谱分类方法技术

技术编号:18942089 阅读:49 留言:0更新日期:2018-09-15 11:23
本发明专利技术涉及数据分类领域,公开了一种基于数据分布特征及模糊隶属度函数的恒星光谱分类方法,以提升恒星光谱分类的效率。本发明专利技术在恒星光谱分类时,采用双支持向量机将恒星光谱中的两类分开,所述双支持向量机引入了线性判别分析中的类间离散度和类内离散度,用以表征光谱数据的分布性状,引入了模糊隶属度函数,用以降低噪声点和奇异点对分类结果的影响。本发明专利技术适用于恒星光谱分类。

Stellar spectral classification method based on data distribution and fuzzy membership function

The invention relates to the field of data classification, and discloses a star spectral classification method based on data distribution characteristics and fuzzy membership function to improve the efficiency of star spectral classification. In stellar spectral classification, the two classes of stellar spectra are separated by using double support vector machines. The double support vector machines introduce the inter-class dispersion and intra-class dispersion in linear discriminant analysis to characterize the distribution characteristics of spectral data, and introduce fuzzy membership function to reduce noise and singularity points. Impact on classification results. The invention is suitable for star spectral classification.

【技术实现步骤摘要】
基于数据分布特征及模糊隶属度函数的恒星光谱分类方法
本专利技术涉及数据分类领域,特别涉及基于数据分布特征及模糊隶属度函数的恒星光谱分类方法。
技术介绍
恒星光谱分类是天文学研究的一个热点问题。随着观测光谱数量的急剧增加,传统的人工分类方法满足解决实际需求,急需利用自动化技术,特别是数据挖掘算法来对恒星光谱进行自动分类。关联规则、神经网络、自组织网络等数据挖掘算法已广泛应用于恒星光谱分类。其中,支持向量机(SupportVectorMachine,SVM)分类能力突出,被广泛应用于恒星光谱分类。该方法试图在两类样本之间找到一个最优分类超平面将两类分开。该方法具有较高的时间复杂度,计算效率有限。双支持向量机(TwinSupportVectorMachine,TWSVM)的出现有效地解决了SVM面临的效率问题。该方法通过构造两个非平行的分类超平面将两类分开,每一类靠近某个分类超平面,而远离另一个分类超平面。TWSVM的计算效率较之传统SVM提高近4倍,因此,自TWSVM提出后便受到研究人员的持续关注。但上述方法在分类决策时,一方面没有考虑数据的分布特征,另一方面较易受噪声点和奇异点的影响,分类效率难以显著提升。
技术实现思路
本专利技术要解决的技术问题是:提供一种基于数据分布特征及模糊隶属度函数的恒星光谱分类方法,以提升恒星光谱分类的效率。为解决上述问题,本专利技术采用的技术方案是:在恒星光谱分类时,采用融合了数据分布特征的模糊双支持向量机(FuzzyTwinSupportVectorMachinewithSpectralDistributionProperties,TWSVM-SDP)将恒星光谱中的两类分开,该TWSVM-SDP在TWSVM的基础上,引入了线性判别分析(LinearDiscriminantAnalysis,LDA)中的类间离散度和类内离散度,用以表征光谱数据的分布性状,引入了模糊隶属度函数,用以降低噪声点和奇异点对分类结果的影响。进一步的,本专利技术中TWSVM-SDP算法的具体流程包括:A.将目标光谱分为训练数据集和测试数据集,利用训练数据集建立基于类间离散度、类内离散度以及模糊隶属度函数的双支持向量机模型,所述双支持向量机模型的两个分类超平面的最优化问题为:其约束条件为:s.t.-(Bw++e2b+)T+ξ≥e2ξ≥0其约束条件为:s.t.(Aw-+e1b-)T+ξ≥e1ξ≥0其中,矩阵A和B分别表示属于1类和-1类的数据集,w+和w-分别表示两个分类超平面的法向量,b+和b-分别表示两个分类超平面的位移项,c1和c2分别表示两个分类超平面的惩罚因子;β1和β2为两个分类超平面的平衡参数;e1和e2为全由1组成的列向量,SW为类间离散度,SB为类内离散度,s1和s2分别表示两个分类超平面的模糊隶属度函数,ξ表示松弛因子;B.利用Lagrangian乘子法将双支持向量机模型的两个分类超平面的最优化问题转化为对偶形式,求得两个分类超平面的法向量和位移项,并根据求得的法向量和位移项定义决策函数:C.利用决策函数对测试数据集中的样本进行类属判定。进一步的,步骤B中,利用Lagrangian乘子法将双支持向量机模型的两个分类超平面的最优化问题转化为对偶形式的步骤包括:B1.将双支持向量机模型的两个分类超平面的最优化问题表示为以下Lagrangian函数式:其中,Lagrangian乘子α≥0,β≥0其中,Lagrangian乘子γ≥0,θ≥0;B2.L(w+,b+,ξ,α,β)分别对w+,b+,ξ求导并令导数等于0,得到:0≤α≤c1s1L(w-,b-,ξ,γ,θ)分别对w-,b-,ξ求导并令导数等于0,得到:0≤γ≤c2s2;B3.将步骤B2得到的等式代入步骤B1中的Lagrangian函数式分别得到以下对偶形式:其约束条件为:s.t.0≤α≤c1s1其约束条件为:s.t.0≤γ≤c2s2。进一步的,所述决策函数为:本专利技术的有益效果是:本专利技术恒星光谱分类时,提出一种融合数据分布特征的模糊双支持向量机(FuzzyTwinSupportVectorMachinewithSpectralDistributionProperties,TWSVM-SDP),该TWSVM-SDP通过引入线性判别分析(LinearDiscriminantAnalysis,LDA)的类间离散度和类内离散度,从而使算法考虑了光谱数据的分布性状;通过引入模糊隶属度函数,从而使算法降低了噪声点和奇异点对分类结果的影响。在SDSSDR8恒星光谱数据集上的比较实验表明,与支持向量机SVM、双支持向量机TWSVM等传统分类方法相比,本专利技术的TWSVM-SDP具有更优的分类能力。具体实施方式本专利技术针对传统双支持向量机在分类决策时并未考虑数据的分布特征,且易受噪声点和奇异点的影响的情况。在恒星光谱分类时,提出一种融合数据分布特征的模糊双支持向量机TWSVM-SDP。该TWSVM-SDP在双支持向量机TWSVM的基础上,通过引入LDA中的类间离散度SW和类内离散度SB用以表征光谱数据的分布特征,引入模糊隶属度函数s用以降低噪声点和奇异点对分类结果的影响。SDSSDR8恒星光谱数据集上的比较实验表明,与传统的SVM和TWSVM相比,TWSVM-SDP具有更优的分类能力。1.在介绍本专利技术之前,以下通过1.1-1.3先对SVM和TWSVM、以及LDA进行简单说明。假设给定N个样本集为X={(x1y1),...,(xN,yN)},其中xi∈Rm,yi∈{-1,1}为类别标签。当1≤i≤N1时,yi=1;当1≤i≤N2时,yi=-1,且N=N1+N2。1.1支持向量机支持向量机通过构造一个分类超平面将两类隔开。设分类超平面为wTx+b=0,分类间隔为2/||w||,SVM的最优化问题可描述为:s.t.yi(wTxi+b)≥1-ξi,ξi≥0i=1,...,N其中,C为惩罚因子,ξi为松弛因子。由Lagrangian定理将原问题转化为如下对偶问题:s.t.αTY=0,α≥0其中α=[α1,…,αN]T,1=[1,…,1]T,Y=[y1,…,yN]T,0=[0,…,0]T。1.2双支持向量机双支持向量机TWSVM试图找到两个非平行的分类超平面将两类分开。设矩阵A和B分别表示属于1类和-1类的数据集,设两类超平面方程分别为和则TWSVM的最优化问题可表示为以下形式:TWSVM1s.t.-(Bw++e2b+)T+ξ≥e2ξ≥0TWSVM2s.t.(Aw-+e1b-)T+ξ≥e1ξ≥0其中,c1和c2分别表示两个分类超平面的惩罚因子;e1和e2为全由1组成的列向量,ξ为松弛因子。由Lagrangian定理将原问题转化为如下对偶形式:TWSVM1s.t.0≤α≤c1其中,H=[Ae1],G=[Be2]。TWSVM2s.t.0≤γ≤c2其中,P=[Ae1],Q=[Be2]。1.3LDALDA是一种经典的特征提取方法,该方法提取的特征具有很好的可分性,即同类之间的距离尽可能近,异类之间的距离尽可能远。其优化问题可描述为:其中c表示类别数,Ni表示第i类的规模,和分别表示第i类均值和所有光谱数据均值。2.本专利技术TWSVM-SDP原理本专利技术的融合数据分布特征的模糊双支持向量机T本文档来自技高网...

【技术保护点】
1.基于数据分布特征及模糊隶属度函数的恒星光谱分类方法,采用双支持向量机将恒星光谱中的两类分开,其特征在于,所述双支持向量机引入了线性判别分析中的类间离散度和类内离散度,用以表征光谱数据的分布性状,引入了模糊隶属度函数,用以降低噪声点和奇异点对分类结果的影响。

【技术特征摘要】
1.基于数据分布特征及模糊隶属度函数的恒星光谱分类方法,采用双支持向量机将恒星光谱中的两类分开,其特征在于,所述双支持向量机引入了线性判别分析中的类间离散度和类内离散度,用以表征光谱数据的分布性状,引入了模糊隶属度函数,用以降低噪声点和奇异点对分类结果的影响。2.如权利要求1所述的基于数据分布特征及模糊隶属度函数的恒星光谱分类方法,其特征在于,所述双支持向量机算法的具体流程包括:A.将目标光谱分为训练数据集和测试数据集,利用训练数据集建立基于类间离散度、类内离散度以及模糊隶属度函数的双支持向量机模型,所述双支持向量机模型的两个分类超平面的最优化问题为:其约束条件为:s.t.-(Bw++e2b+)T+ξ≥e2ξ≥0其约束条件为:s.t.(Aw_+e1b_)T+ξ≥e1ξ≥0其中,矩阵A和B分别表示属于1类和-1类的数据集,w+和w_分别表示两个分类超平面的法向量,b+和b_分别表示两个分类超平面的位移项,c1和c2分别表示两个分类超平面的惩罚因子;β1和β2为两个分类超平面的平衡参数;e1和e2为全由1组成的列向量,SW为类间离散度,SB为类内离散度,s1和s2分别表示两个分类超平面的模糊隶属度函数,ξ表示松弛因子;B.利用Lag...

【专利技术属性】
技术研发人员:刘忠宝秦振涛罗学刚周方晓张靖
申请(专利权)人:攀枝花学院
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1