The invention relates to the field of data classification, and discloses a star spectral classification method based on data distribution characteristics and fuzzy membership function to improve the efficiency of star spectral classification. In stellar spectral classification, the two classes of stellar spectra are separated by using double support vector machines. The double support vector machines introduce the inter-class dispersion and intra-class dispersion in linear discriminant analysis to characterize the distribution characteristics of spectral data, and introduce fuzzy membership function to reduce noise and singularity points. Impact on classification results. The invention is suitable for star spectral classification.
【技术实现步骤摘要】
基于数据分布特征及模糊隶属度函数的恒星光谱分类方法
本专利技术涉及数据分类领域,特别涉及基于数据分布特征及模糊隶属度函数的恒星光谱分类方法。
技术介绍
恒星光谱分类是天文学研究的一个热点问题。随着观测光谱数量的急剧增加,传统的人工分类方法满足解决实际需求,急需利用自动化技术,特别是数据挖掘算法来对恒星光谱进行自动分类。关联规则、神经网络、自组织网络等数据挖掘算法已广泛应用于恒星光谱分类。其中,支持向量机(SupportVectorMachine,SVM)分类能力突出,被广泛应用于恒星光谱分类。该方法试图在两类样本之间找到一个最优分类超平面将两类分开。该方法具有较高的时间复杂度,计算效率有限。双支持向量机(TwinSupportVectorMachine,TWSVM)的出现有效地解决了SVM面临的效率问题。该方法通过构造两个非平行的分类超平面将两类分开,每一类靠近某个分类超平面,而远离另一个分类超平面。TWSVM的计算效率较之传统SVM提高近4倍,因此,自TWSVM提出后便受到研究人员的持续关注。但上述方法在分类决策时,一方面没有考虑数据的分布特征,另一方面较易受噪声点和奇异点的影响,分类效率难以显著提升。
技术实现思路
本专利技术要解决的技术问题是:提供一种基于数据分布特征及模糊隶属度函数的恒星光谱分类方法,以提升恒星光谱分类的效率。为解决上述问题,本专利技术采用的技术方案是:在恒星光谱分类时,采用融合了数据分布特征的模糊双支持向量机(FuzzyTwinSupportVectorMachinewithSpectralDistributionProperties ...
【技术保护点】
1.基于数据分布特征及模糊隶属度函数的恒星光谱分类方法,采用双支持向量机将恒星光谱中的两类分开,其特征在于,所述双支持向量机引入了线性判别分析中的类间离散度和类内离散度,用以表征光谱数据的分布性状,引入了模糊隶属度函数,用以降低噪声点和奇异点对分类结果的影响。
【技术特征摘要】
1.基于数据分布特征及模糊隶属度函数的恒星光谱分类方法,采用双支持向量机将恒星光谱中的两类分开,其特征在于,所述双支持向量机引入了线性判别分析中的类间离散度和类内离散度,用以表征光谱数据的分布性状,引入了模糊隶属度函数,用以降低噪声点和奇异点对分类结果的影响。2.如权利要求1所述的基于数据分布特征及模糊隶属度函数的恒星光谱分类方法,其特征在于,所述双支持向量机算法的具体流程包括:A.将目标光谱分为训练数据集和测试数据集,利用训练数据集建立基于类间离散度、类内离散度以及模糊隶属度函数的双支持向量机模型,所述双支持向量机模型的两个分类超平面的最优化问题为:其约束条件为:s.t.-(Bw++e2b+)T+ξ≥e2ξ≥0其约束条件为:s.t.(Aw_+e1b_)T+ξ≥e1ξ≥0其中,矩阵A和B分别表示属于1类和-1类的数据集,w+和w_分别表示两个分类超平面的法向量,b+和b_分别表示两个分类超平面的位移项,c1和c2分别表示两个分类超平面的惩罚因子;β1和β2为两个分类超平面的平衡参数;e1和e2为全由1组成的列向量,SW为类间离散度,SB为类内离散度,s1和s2分别表示两个分类超平面的模糊隶属度函数,ξ表示松弛因子;B.利用Lag...
【专利技术属性】
技术研发人员:刘忠宝,秦振涛,罗学刚,周方晓,张靖,
申请(专利权)人:攀枝花学院,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。