一种数据分类方法、装置、电子设备及存储介质制造方法及图纸

技术编号:43071168 阅读:19 留言:0更新日期:2024-10-22 14:46
本申请涉及计算机技术领域,提供一种数据分类方法、装置、电子设备及存储介质,能够提高分类的精度和效率。该方法通过将目标业务关联的待处理数据集拆分为多个数据子集分别进行聚类,从而降低待处理数据的特征维度,提高数据分类的效率,并且,聚类时采用的目标分类模型的分类数是通过调整聚类中心和增益系数确定的,从而能够自适应待处理数据集中各待处理数据的分布,降低噪声的影响,从而提高分类的准确性;此外,通过聚类获得待处理数据集的各初始类别后,采用基于概率模型的决策方法,确定各待处理数据所属的目标类别,进一步提高了分类的准确性。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及一种数据分类方法、装置、电子设备及存储介质


技术介绍

1、传统的模式识别任务主要采用统计学习、机器学习等方法,对数据进行特征提取和分类,而这些方法在对大数据进行分类时,存在着特征维度大、计算复杂度高等诸多问题。

2、近年来,随着神经网络的发展,基于神经网络的聚类算法得到了广泛的应用,如异常数据识别、图片分类等。该方法通过大量的数据集对神经网络进行训练后,获得最佳的神经网络,并通过最佳的神经网络对新输入数据集进行模式识别与分类,因此,训练好的神经网络就像一个“黑盒”,给定一个输入,获得一个输出,无需知道数据处理的具体过程。然而,基于神经网络的聚类算法需要手动设置聚类中心和分类数,且设置后保持不变,这样,会导致数据受到噪声的影响较大,降低聚类的准确性。

3、因此,提高数据分类的准确性,成为模式识别任务中亟待解决的问题。


技术实现思路

1、本申请实施例提供了一种数据分类方法,用于提高数据分类的准确性。

2、一方面,本申请实施例提供一种数据分类方法,包括本文档来自技高网...

【技术保护点】

1.一种数据分类方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述基于已训练的目标分类模型,分别对所述多个数据子集进行聚类,获得所述待处理数据集的各初始类别,包括:

3.如权利要求1所述的方法,其特征在于,所述基于所述待处理数据的至少一个维度的业务特征,获得所述待处理数据分别属于所述各初始类别的目标概率,包括:

4.如权利要求3所述的方法,其特征在于,获得所述待处理数据在所述各初始类别中分别出现的初始概率之后,计算所述待处理数据分别属于所述各初始类别的目标概率之前,所述方法还包括:

5.如权利要求1-4中任一项所...

【技术特征摘要】

1.一种数据分类方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述基于已训练的目标分类模型,分别对所述多个数据子集进行聚类,获得所述待处理数据集的各初始类别,包括:

3.如权利要求1所述的方法,其特征在于,所述基于所述待处理数据的至少一个维度的业务特征,获得所述待处理数据分别属于所述各初始类别的目标概率,包括:

4.如权利要求3所述的方法,其特征在于,获得所述待处理数据在所述各初始类别中分别出现的初始概率之后,计算所述待处理数据分别属于所述各初始类别的目标概率之前,所述方法还包括:

5.如权利要求1-4中任一项所述的方法,其特征在于,所述目标分类模型是通过以下方式确定的:

6.如权利要求5所述的方法,其特征在于,所述对一个样本子集进行聚类,获得所述一个样本子集的多个聚类中心及其各自的增益系数,包括:

7.如权利要求5所述的方法,其特征在于,获得基于所述一个样本子集训练后的网络权重和偏置后,所述方法还包括:

8.如权利要求1-4中任一项所述的方法,其特征在于,当所述待处理数据...

【专利技术属性】
技术研发人员:林岳
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1