The invention discloses a group data classification method and device based on SVM. The method includes: step S1, extracting historical group data, determining the characteristic data of groups and groups; step S2, constructing two characteristic matrix of the group according to the characteristic data; step S3, training pairs according to the two characteristic matrix. The corresponding SVM classifier; step S4, using the SVM classifier to classify the classified group data; its device includes the corresponding historical data processing unit, the feature matrix construction unit, the classifier training unit and the classifier classification unit. In this way, the group data can be classified by computer, it is convenient, fast, and saves great manpower and material resources. In addition, compared with other classifiers, SVM has a great improvement in classifier performance, and has the advantage of high classification precision, thus improving the accuracy of group composition analysis.
【技术实现步骤摘要】
一种基于SVM的群体数据分类方法及装置
本专利技术涉及数据分类领域,具体涉及一种基于SVM的群体数据分类方法及装置。
技术介绍
市场研究是一门由来已久的学科,这么多年的发展历史中,涌现了很多研究方法。进入二十一世纪以后,随着计算机技术的发展,市场研究领域也慢慢的将调研的计算平台转移到计算机上。使用计算机来进行市场数据的分析,能够快速的产生报表跟各类可视化的数据模型,大大减少了人工的计算量以及调研的时间,提高了准确度。在这个由信息主导的时代,我们对于信息的重视程度越来越高。同样,在研究某个群体的过程中,了解这个群体的组成,也是必不可少的。对群体组成的分析,其实质上就是根据历史数据来对样本群体数据进行分类,但是目前的分类方法主要是通过人工进行,不仅工作量大,而且费时费力。因此,需要一种可以通过计算机对群体数据进行分类的方法及装置。鉴于上述缺陷,本专利技术创作者经过长时间的研究和实践终于获得了本专利技术。
技术实现思路
为解决上述技术缺陷,本专利技术采用的技术方案在于,首先提供一种基于SVM的群体数据分类方法,其包括:步骤S1,提取历史群体数据,确定群体及群体的特征数据;步骤S2,根据所述特征数据,构建所述群体的二次特征矩阵;步骤S3,根据所述二次特征矩阵,训练对应的SVM分类器;步骤S4,使用所述SVM分类器对待分类群体数据进行分类。较佳的,所述步骤2包括:步骤S21,分析群体的特征数据,从中提取出群体各个类别对应的基本特征;步骤S22,将所述历史群体数据中的数据转化为特征向量;步骤S24,以所述特征向量构建群体的二次特征矩阵。较佳的,所述步骤2还包括:步骤S23 ...
【技术保护点】
1.一种基于SVM的群体数据分类方法,其特征在于,包括:步骤S1,提取历史群体数据,确定群体及群体的特征数据;步骤S2,根据所述特征数据,构建所述群体的二次特征矩阵;步骤S3,根据所述二次特征矩阵,训练对应的SVM分类器;步骤S4,使用所述SVM分类器对待分类群体数据进行分类。
【技术特征摘要】
1.一种基于SVM的群体数据分类方法,其特征在于,包括:步骤S1,提取历史群体数据,确定群体及群体的特征数据;步骤S2,根据所述特征数据,构建所述群体的二次特征矩阵;步骤S3,根据所述二次特征矩阵,训练对应的SVM分类器;步骤S4,使用所述SVM分类器对待分类群体数据进行分类。2.如权利要求1所述的基于SVM的群体数据分类方法,其特征在于,所述步骤2包括:步骤S21,分析群体的特征数据,从中提取出群体各个类别对应的基本特征;步骤S22,将所述历史群体数据中的数据转化为特征向量;步骤S24,以所述特征向量构建群体的二次特征矩阵。3.如权利要求2所述的基于SVM的群体数据分类方法,其特征在于,所述步骤2还包括:步骤S23,根据特征数据的重要程度而赋予其不同的权值,并修正所述特征向量。4.如权利要求1-3中任一所述的基于SVM的群体数据分类方法,其特征在于,所述步骤3包括:步骤S31,在所述二次特征矩阵中加入群体中各个类别的分类信息;步骤S32,对具有所述分类信息的所述二次特征矩阵进行学习,在所述特征向量与群体的所述分类信息之间建立对应关系,训练所述SVM分类器,得到其判断函数。5.如权利要求1-3中任一所述的基于SVM的群体数据分类方法,其特征在于,所述步骤S2中,所述二次特征矩阵中行向量和列向量分别表示群体的每个个体和群体的特征数据,所述二次特征矩阵中的每一个元素均为对应的群体中个体及特征数据的关联度。6.如权利要求1-3中任一所述的基于SVM的群体数据分类方法,其特征在于,所述步...
【专利技术属性】
技术研发人员:黄超,李青海,潘宇翔,王平,张晓亭,杨婉,
申请(专利权)人:广东精点数据科技股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。