一种类别确定方法及装置制造方法及图纸

技术编号：25088064 阅读：29 留言：0更新日期：2020-07-31 23:32

本申请提供了类别确定方法及装置，获取待分类样本和训练样本集，其中，训练样本集中包括历史样本及该每个历史样本所属的类别。从训练样本集中选取与待分类样本之间的距离最近的k个近邻样本。然后利用待分类样本与k个近邻样本之间的距离获得k个近邻样本所属各个类别的权重。依据各个类别的权重，从各个类别中选取待分类样本所属的目标类别。其中，距离待分类样本越近的历史样本对待分类样本的类别确定的影响越大，该历史样本对应的类别权重越大。因此，利用该方案确定出的类别结果准确率更高，而且，降低了k的取值对类别结果的影响。

全部详细技术资料下载

【技术实现步骤摘要】
一种类别确定方法及装置
本专利技术属于分类
，尤其涉及一种类别确定方法及装置。
技术介绍
分类的目的是确定一个样本的类别，具体的类别是已知的，常用的算法是k近邻算法(k-nearestneighbor，KNN)，KNN算法是一种有监督学习算法，其基本方法是：给定测试数据，基于距离度量找出训练样本集中与测试数据最近的k个数据点(即，k个近邻样本)，然后，基于这k个近邻样本确定测试数据所属的类别。但是目前的KNN算法的分类结果准确率较低，无法适应于准确率较高的场景。
技术实现思路
有鉴于此，本申请的目的在于提供一种类别确定方法及装置，以确定样本所属的类别，其具体的技术方案如下：本申请提供了一种类别确定方法，包括：获取待分类数据和训练样本集，所述训练样本集包括历史样本和该历史样本所属的类别；从所述训练样本集中选取与所述待分类样本之间的距离最近的k个近邻样本；利用所述待分类样本分别与所述k个近邻样本之间的距离，计算所述k个近邻样本所属的各个类别的权重；依据所述各个类别的权重，确定所述待分类样本所属的目标类别。本申请提供的类别确定方法，获取待分类样本和训练样本集，其中，训练样本集中包括历史样本及该每个历史样本所属的类别。从训练样本集中选取与待分类样本之间的距离最近的k个近邻样本。然后利用待分类样本与k个近邻样本之间的距离获得k个近邻样本所属各个类别的权重。依据各个类别的权重，从各个类别中选取待分类样本所属的目标类别。该方案依据待分类样本的k个近邻样本与待分类样本之间的距离计算得到k个近...

【技术保护点】
1.一种类别确定方法，其特征在于，包括：/n获取待分类数据和训练样本集，所述训练样本集包括历史样本和该历史样本所属的类别；/n从所述训练样本集中选取与所述待分类样本之间的距离最近的k个近邻样本；/n利用所述待分类样本分别与所述k个近邻样本之间的距离，计算所述k个近邻样本所属的各个类别的权重；/n依据所述各个类别的权重，确定所述待分类样本所属的目标类别。/n

【技术特征摘要】
1.一种类别确定方法，其特征在于，包括：
获取待分类数据和训练样本集，所述训练样本集包括历史样本和该历史样本所属的类别；
从所述训练样本集中选取与所述待分类样本之间的距离最近的k个近邻样本；
利用所述待分类样本分别与所述k个近邻样本之间的距离，计算所述k个近邻样本所属的各个类别的权重；
依据所述各个类别的权重，确定所述待分类样本所属的目标类别。

2.根据权利要求1所述的方法，其特征在于，所述从训练样本集中选取与所述待分类出行特征向量距离最近的k个近邻样本，包括：
获取所述待分类样本，以及所述训练样本集中各个历史样本；
分别计算所述待分类样本与各个历史样本之间的距离；
按照所述距离由小到大的顺序，依次选取k个历史样本确定为所述待分类样本的k个近邻样本。

3.根据权利要求1所述的方法，其特征在于，所述利用所述待分类样本分别与所述k个近邻样本之间的距离，计算所述k个近邻样本所属的各个类别的权重，包括：
计算属于同一类别的各个近邻样本与所述待分类样本之间的距离的倒数之和，得到该类别对应的权重。

4.根据权利要求1所述的方法，其特征在于，依据所述各个类别的权重，从所述k个近邻样本所属的各个类别中选取所述待分类样本所属的目标类别，包括：
从所述k个近邻样本所属的各个类别中，选取权重最大的类别确定为所述待分类样本的目标类别。

5.根据权利要求2所述的方法，其特征在于，待分类样本为出行样本，
获取样本的过程，包括：
从出行样本中获取表征旅客出行意图的旅客出行信息，所述旅客出行信息包括旅客性别、旅客年龄、旅客团体或非团体标识、出行日期是否节假日、出发城市、目的城市、出发城市和目的城市是否旅游城市；
将所述旅客出行信息转换为向量得到所述样本。

6.根据权利要求5所述的方法，其特征在于，所述从出行样本中获取表征旅客出行意图的旅客出行信息，包括：
从所述出行样本中获取旅客性别；
从所述出行样本中获...

【专利技术属性】
技术研发人员：孟雷，张劼，李永江，
申请(专利权)人：中国民航信息网络股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人