一种基于样本集的多属性目标的分类方法技术

技术编号：28210943 阅读：32 留言：0更新日期：2021-04-24 14:46

本发明专利技术公开一种基于样本集的多属性目标的分类方法，根据已知样本集和待分类目标的已知属性，筛选出样本子集，如果筛选出的样本自己具有单一的类别属性，则待分类目标的类别为该单一类别；否则选择待分类目标的一个新已知属性，对筛选出的样本子集继续进行筛选，直到本次分类完成或本次分类失败。本发明专利技术可以实现分类的可解释性，给出样本集和分类方法的改进方向，将复杂的多维分类问题简化为单维度样本筛选，提供了探索式的目标分类方法，提升了分类方法的效率。类方法的效率。类方法的效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于样本集的多属性目标的分类方法

[0001]本专利技术属于机器学习、人工智能
，具体涉及一种分类方法。

技术介绍

[0002]分类问题的目标是根据已知样本的某些特征，判断一个新的样本属于哪种已知的样本类。根据类别的数量还可以进一步将分类问题划分为二元分类(binary classification)和多元分类(multiclass classification)。
[0003]例如，在邮件管理中，将一封邮件归类为“垃圾邮件”或者“非垃圾邮件”就是一个典型的二元分类问题；银行对信用卡客户进行信用等级分类和上市公司股票类型的划分则属于多元分类问题。
[0004]经过多年的发展，机器学习发展出众多的分类方法，常见的分类方法包括：
[0005]线性分类器
[0006]朴素贝叶斯分类器(naive bayes classifier)
[0007]感知器(perceptron)
[0008]支持向量机(support vector machine)
[0009]最近邻居法(k
‑
nearest neighbor)
[0010]决策树(decision trees)
[0011]随机森林(random forests)
[0012]神经网络(neural networks)
[0013]其中，线性分类器中的判别分析和逻辑回归是最基础、最具代表性的分类方法。判别分析是一种简单直观的分类方法，它基于观测值与不同类别之间...

【技术保护点】

【技术特征摘要】
1.一种基于样本集的多属性目标的分类方法，其特征在于：所述样本集为已知样本集，所述已知样本集包含至少一个样本，所述已知样本集中的样本至少具有类别属性，且所述已知样本集中的样本的所有属性的取值为已知；对于一个具有与所述已知样本集中的样本部分或者全部相同的属性，且类别属性的值未知，其他属性的值已知的待分类目标，分类方法包括如下步骤：1）选择待分类目标的一个已知属性，将所述已知样本集作为待筛选样本集；2）根据所选择的待分类目标的已知属性的取值，在给定的阈值范围内，从待筛选样本集中筛选出样本子集；3）判断筛选出的样本子集是否具有单一的类别属性，如果是，则待分类目标的类别为该单一类别；否则选择待分类目标的一个新的已知属性，将筛选出的样本子集作为待筛选样本集，重复步骤2）、3），直到本次分类完成或本次分类失败。2.如权利要求1所述的基于样本集的多属性目标的分类方法，如果分类过程中筛选出的样本子集为空，则本次分类失败。3.如权利要求2所述的基于样本集的多属性目标的分类方法，其特征在于：在本次分类失败情况下，对该待分类目标进行人为类别判定，将该待分类目标以及人为判定的类别信息加入所述已知样本集中，用于后续其他目标的分类。4.如权利要求1所述的基于样本集的多属性目标的分类方法，如果待分类目标的所有已知属性遍历...

【专利技术属性】
技术研发人员：邓少冬，
申请(专利权)人：西安米克斯智能技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人