高维数据分类方法、装置、设备及存储介质制造方法及图纸

技术编号:28560336 阅读:32 留言:0更新日期:2021-05-25 17:55
本发明专利技术公开一种高维数据分类方法、装置、设备及存储介质。该方法包括:获取待分类高维数据;对待分类高维数据的各维特征向量进行归一化处理;根据基于训练样本的总类内散度矩阵和总类间散度矩阵构建的特征映射模型,确定各训练样本的投影样本;确定预设的分类器结构中的各二分类器中各训练样本的投影样本的均值;根据特征映射模型,确定待分类高维数据的投影数据;将待分类高维数据的投影数据与各二分类器中训练样本的投影样本的均值进行比较,分别获得各二分类器的比较结果;以及根据各二分类器的比较结果,确定待分类高维数据的类别。该方法能够实现多分类问题的一步快速准确预测,提升高维数据分类的速度。

【技术实现步骤摘要】
高维数据分类方法、装置、设备及存储介质
本专利技术涉及数据分类领域,具体而言,涉及一种高维数据分类方法、装置、设备及存储介质。
技术介绍
目前数据分类已经在许多业务中得到使用,例如健康风险预测、核保结论预测、理赔风险预测、财务发票分类识别等,并且随着OCR(OpticalCharacterRecognition,光学字符识别)、文本分析等技术的普及,分类问题作为一个基础前置技术正逐渐成为一个不可忽视或者无法绕开的技术点,因此,研究分类技术无论对于业务应用还是基础技术研发都有重要的意义和价值。目前可用于高维数据多分类的方法非常多,例如支持向量机、深度神经网络等。支持向量机是采用特征升维的思路实现分类,深度神经网络是采用统计学习的思路实现多分类。深度学习技术存在诸多问题,例如模型笨重,需要的存储空间和计算量较大,使得在传统CPU(CentralProcessingUnit,中央处理器)架构下运行速度非常慢,而GPU(GraphicsProcessingUnit,图形处理器)的成本非常高。在所述
技术介绍
部分公开的上述信息仅用于加强对本本文档来自技高网...

【技术保护点】
1.一种高维数据分类方法,其特征在于,包括:/n获取待分类高维数据;/n对所述待分类高维数据的各维特征向量进行归一化处理;/n根据基于训练样本的总类内散度矩阵和总类间散度矩阵构建的特征映射模型,确定各训练样本的投影样本;/n确定预设的分类器结构中的各二分类器中各训练样本的投影样本的均值;/n根据所述特征映射模型,确定所述待分类高维数据的投影数据;/n将所述待分类高维数据的投影数据与所述各二分类器中所述训练样本的投影样本的均值进行比较,分别获得各二分类器的比较结果;以及/n根据各二分类器的比较结果,确定所述待分类高维数据的类别。/n

【技术特征摘要】
1.一种高维数据分类方法,其特征在于,包括:
获取待分类高维数据;
对所述待分类高维数据的各维特征向量进行归一化处理;
根据基于训练样本的总类内散度矩阵和总类间散度矩阵构建的特征映射模型,确定各训练样本的投影样本;
确定预设的分类器结构中的各二分类器中各训练样本的投影样本的均值;
根据所述特征映射模型,确定所述待分类高维数据的投影数据;
将所述待分类高维数据的投影数据与所述各二分类器中所述训练样本的投影样本的均值进行比较,分别获得各二分类器的比较结果;以及
根据各二分类器的比较结果,确定所述待分类高维数据的类别。


2.根据权利要求1所述的方法,其特征在于,当所述类别的数量为k时,所述分类器的数量为k-1。


3.根据权利要求2所述的方法,其特征在于,所述预设的分类器结构由以下公式确定:
二分类器1:{C1}:{C2,C3,…Cj,…,Ck}
二分类器2:{C1,C2}:{C3,C4,…Cj,…,Ck}
……
二分类器k-1:{C1,C2,…,Cj,…,Ck-1}:{Ck}
其中,{C1,C2,…Cj,…,Ck}为所述类别的集合,“:”表示二分类器的间隔。


4.根据权利要求1所述的方法,其特征在于,所述特征映射模型根据下述公式获得:



其中,Sw为所述总类内散度矩阵,Sb为所述总类间散度矩阵。


5.根据权利要求4所述的方法,其特征在于,各训练样本的投影样本为所述特征映射模型的转置矩阵与各训练样本的乘积,所述待分类高维数据的投影数据为所述特征映射模型的转置矩阵与所述待分类高维数据的乘积。...

【专利技术属性】
技术研发人员:刘岩
申请(专利权)人:泰康保险集团股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1