当前位置: 首页 > 专利查询>苏州大学专利>正文

基于支持向量数据描述的特征提取及分类方法及其系统技术方案

技术编号:14687735 阅读:106 留言:0更新日期:2017-02-23 09:59
本发明专利技术公开了一种基于支持向量数据描述的特征提取及分类方法,包括分别计算每个样本到对应于各种数据类型的多个超球体模型的球心的欧式距离;其中多个超球体模型采用支持向量数据描述算法预先训练得到;将各个欧式距离与其对应的超球体模型的半径带入新特征关系式,得到每个样本对应的新特征样本;各个新特征样本的集合为新特征样本集;采用预设分类算法对新特征样本集进行分类处理,得到分类结果。本发明专利技术能够减小特征提取时的计算量,提高数据分类的速度。本发明专利技术还提供了一种采用上述方法的基于支持向量数据描述的特征提取及分类系统,具有上述优点,在此不再赘述。

【技术实现步骤摘要】

本专利技术涉及特征提取
,特别是涉及一种基于支持向量数据描述的特征提取及分类方法及其系统
技术介绍
特征提取作为一种常用的降维方法,主要用来处理包含大量对象的任务。这些任务中涉及的样本一般都是有着固定特征的大容量数据,可以是二值的,离散多值的或者连续的数据。在进行数据处理过程中,使用所有数据的全部信息虽更有利于获得精准的判断决策,但是在实际操作时,数据的原始信息中往往会包含了相关、噪声甚至冗余的变量或者属性,不对数据进行处理而直接应用,会导致大量的成本支出,这些可能的成本包括内存容量大小、时间复杂度和决策精度等。为了提高数据存储和计算性能,需要采用特征提取方法来找到原始数据中紧凑的样本信息。特征提取是通过从原始输入数据中捕获关键关联信息,来构建一个新的特征子集。在特征提取方法中,每一个新的特征都是所有原始特征的函数映射。目前多采用基于支持向量机(SupportVectorMachine,SVM)的特征提取方法。SVM是一种构建超平面的二分类方法,通过一对一和一对多的模式来构建多类数据之间的分类,并计算样本到超平面的距离来构建新特征。该方法充分考虑了不同类别的数据信息,但是当数据量较大时,计算复杂度也会十分明显,尤其是一对多方法。因此,如何提供一种计算量小的基于支持向量数据描述的特征提取及分类方法及其系统是本领域技术人员目前需要解决的问题。
技术实现思路
本专利技术的目的是提供一种基于支持向量数据描述的特征提取及分类方法及其系统,能够减小特征提取时的计算量,提高数据分类的速度。为解决上述技术问题,本专利技术提供了一种基于支持向量数据描述的特征提取及分类方法,包括:分别计算每个样本到对应于各种数据类型的多个超球体模型的球心的欧式距离;其中多个所述超球体模型采用支持向量数据描述算法预先训练得到;将各个所述欧式距离与其对应的所述超球体模型的半径带入新特征关系式,得到每个所述样本对应的新特征样本;各个所述新特征样本的集合为新特征样本集;采用预设分类算法对所述新特征样本集进行分类处理,得到分类结果。优选地,所述多个所述超球体模型的获得过程具体为:将预先获得的原始训练样本按照数据类别分为J个训练子集Xj={(xi,yi)|xi∈Rm,yi=j,i=1,…,nj本文档来自技高网...
基于支持向量数据描述的特征提取及分类方法及其系统

【技术保护点】
一种基于支持向量数据描述的特征提取及分类方法,其特征在于,包括:分别计算每个样本到对应于各种数据类型的多个超球体模型的球心的欧式距离;其中多个所述超球体模型采用支持向量数据描述算法预先训练得到;将各个所述欧式距离与其对应的所述超球体模型的半径带入新特征关系式,得到每个所述样本对应的新特征样本;各个所述新特征样本的集合为新特征样本集;采用预设分类算法对所述新特征样本集进行分类处理,得到分类结果。

【技术特征摘要】
1.一种基于支持向量数据描述的特征提取及分类方法,其特征在于,包括:分别计算每个样本到对应于各种数据类型的多个超球体模型的球心的欧式距离;其中多个所述超球体模型采用支持向量数据描述算法预先训练得到;将各个所述欧式距离与其对应的所述超球体模型的半径带入新特征关系式,得到每个所述样本对应的新特征样本;...

【专利技术属性】
技术研发人员:张莉卢星凝王邦军李凡长张召
申请(专利权)人:苏州大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1