一种基于聚类算法的多特征数据分类识别方法技术

技术编号：20119220 阅读：33 留言：0更新日期：2019-01-16 12:19

一种基于聚类算法的多特征数据分类识别方法，所述方法首先计算多维数据中任意两维特征数值之间的离散度准则函数值，再通过比较各离散度准则函数值的大小提取出能代表待分类数据的二维主特征，然后将待分类的多特征数据转换成仅包含主特征的二维数据；最后采用聚类算法对降维后的二维数据进行分类，从而实现对原多特征数据的准确分类识别。本发明专利技术采用聚类算法对多特征数据进行分类，并在分类前首先对数据进行降维处理，使之仅包含能代表待分类数据的二维主特征，从而消除了多维数据中无效信息对分类造成的不良影响，大大提高了多特征数据分类识别的准确性。

A Classification and Recognition Method of Multi-feature Data Based on Clustering Algorithms

A classification and recognition method for multi-feature data based on clustering algorithm is proposed. The method first calculates the value of the discreteness criterion function between any two-dimensional feature values in multi-dimensional data, then extracts the two-dimensional main features representing the data to be classified by comparing the values of the discreteness criterion function, and then converts the multi-feature data to two-dimensional data containing only the main features. Finally, the clustering algorithm is used to classify the two-dimensional data after dimensionality reduction, so as to realize the accurate classification and recognition of the original multi-feature data. The method adopts clustering algorithm to classify multi-feature data, and first reduces the dimension of the data before classifying, so that it only contains two-dimensional main features representing the data to be classified, thereby eliminating the adverse effect of invalid information in multi-dimensional data on classification, and greatly improving the accuracy of classification and recognition of multi-feature data.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于聚类算法的多特征数据分类识别方法
本专利技术涉及一种基于聚类算法的能够对多特征数据进行准确分类识别方法，属于数据处理

技术介绍
随着科技的发展和人民生活水平的提高，越来越多的科学技术不仅仅被应用在军事领域、航天领域等高精尖行业，而是逐渐进入人们的生活中，为百姓服务。对多特征数据的处理在很多方面都有需求，例如在植物学领域：为了更好地研究植物的生物多样化以及植物的生长状态等方面的问题，需要对于植物的叶片进行分类识别，叶片的多特征数据包括如下特征：虫洞图像、纹理图像、灰度图像，要想对叶片进行分类就需要提取相应的几何特征和结构特征，然后使用主成分分析方法以及线性评判分析方法，就可以实现对植物叶片的准确分类识别。在人类医学领域：传统的医学图像检测方法已经不能满足准确率的要求，为了方便医学理论的研究，使研究人员可以更好地对医学文本书籍进行理解，机器学习可以抽取多特征融合的语义关系，通过支持向量机来实现中文web医学信息语义关系的抽取。在日常生活中也存在多特征数据识别的需求，随着互联网购物潮流的出现，促进了采用图像检索方式进行购物的需求，通过提取纹理特征、轮廓特征和统计特征作为低层特征向量进行特征融合，使用SVM分类器和卷积神经网络来实现服装图像分类识别，消费者得到极大的方便。随着网络生活的逐渐活跃，人们的安全受到了威胁，根据人类的生物特征，例如掌纹和虹膜等明显特征，对人的身份进行识别比传统的密码认证更加安全。这种多特征数据识别技术在公路交通收费和停车场收费方面应用的更多，收费需要区分车辆型号进行分级，因此产生了对于车辆型号进行分类的需求，通过这项技术...

【技术保护点】
1.一种基于聚类算法的多特征数据分类识别方法，其特征是，所述方法首先计算多维数据中任意两维特征数值之间的离散度准则函数值，再通过比较各离散度准则函数值的大小提取出能代表待分类数据的二维主特征，然后将待分类的多特征数据转换成仅包含主特征的二维数据；最后采用聚类算法对降维后的二维数据进行分类，从而实现对原多特征数据的准确分类识别。

【技术特征摘要】
1.一种基于聚类算法的多特征数据分类识别方法，其特征是，所述方法首先计算多维数据中任意两维特征数值之间的离散度准则函数值，再通过比较各离散度准则函数值的大小提取出能代表待分类数据的二维主特征，然后将待分类的多特征数据转换成仅包含主特征的二维数据；最后采用聚类算法对降维后的二维数据进行分类，从而实现对原多特征数据的准确分类识别。2.根据权利要求1所述的一种基于聚类算法的多特征数据分类识别方法，其特征是，所述方法包括以下步骤：a.获得待分类的多特征数据样本集合为E＝(e1,e2,L,eN)；N为聚类样本点的总数，原数据共包含c个类别；b.提取能代表待分类数据的二维主特征，将样本集合中的数据转换为二维数据，具体方法如下：设第i类数据ex的维数为w，特征矢量为X＝(x1,x2,Lxw)，其中xj(j＝1,2,Lw)表示数据ex的第j维特征数值，将所有特征两两组合，得到种特征组合，分别求每种特征组合的离散度准则函数值J：其中：式中mi是第i类数据的均值向量；c为原...

【专利技术属性】
技术研发人员：魏乐，姚伟，徐珮宸，田琪林，
申请(专利权)人：华北电力大学保定，
类型：发明
国别省市：河北,13

全部详细技术资料下载我是这个专利的主人