【技术实现步骤摘要】
本申请涉及计算机,尤其涉及一种数据分类方法、装置、电子设备及存储介质。
技术介绍
1、传统的模式识别任务主要采用统计学习、机器学习等方法,对数据进行特征提取和分类,而这些方法在对大数据进行分类时,存在着特征维度大、计算复杂度高等诸多问题。
2、近年来,随着神经网络的发展,基于神经网络的聚类算法得到了广泛的应用,如异常数据识别、图片分类等。该方法通过大量的数据集对神经网络进行训练后,获得最佳的神经网络,并通过最佳的神经网络对新输入数据集进行模式识别与分类,因此,训练好的神经网络就像一个“黑盒”,给定一个输入,获得一个输出,无需知道数据处理的具体过程。然而,基于神经网络的聚类算法需要手动设置聚类中心和分类数,且设置后保持不变,这样,会导致数据受到噪声的影响较大,降低聚类的准确性。
3、因此,提高数据分类的准确性,成为模式识别任务中亟待解决的问题。
技术实现思路
1、本申请实施例提供了一种数据分类方法,用于提高数据分类的准确性。
2、一方面,本申请实施例提供一
...【技术保护点】
1.一种数据分类方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述基于已训练的目标分类模型,分别对所述多个数据子集进行聚类,获得所述待处理数据集的各初始类别,包括:
3.如权利要求1所述的方法,其特征在于,所述基于所述待处理数据的至少一个维度的业务特征,获得所述待处理数据分别属于所述各初始类别的目标概率,包括:
4.如权利要求3所述的方法,其特征在于,获得所述待处理数据在所述各初始类别中分别出现的初始概率之后,计算所述待处理数据分别属于所述各初始类别的目标概率之前,所述方法还包括:
5.如权利
...【技术特征摘要】
1.一种数据分类方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述基于已训练的目标分类模型,分别对所述多个数据子集进行聚类,获得所述待处理数据集的各初始类别,包括:
3.如权利要求1所述的方法,其特征在于,所述基于所述待处理数据的至少一个维度的业务特征,获得所述待处理数据分别属于所述各初始类别的目标概率,包括:
4.如权利要求3所述的方法,其特征在于,获得所述待处理数据在所述各初始类别中分别出现的初始概率之后,计算所述待处理数据分别属于所述各初始类别的目标概率之前,所述方法还包括:
5.如权利要求1-4中任一项所述的方法,其特征在于,所述目标分类模型是通过以下方式确定的:
6.如权利要求5所述的方法,其特征在于,所述对一个样本子集进行聚类,获得所述一个样本子集的多个聚类中心及其各自的增益系数,包括:
7.如权利要求5所述的方法,其特征在于,获得基于所述一个样本子集训练后的网络权重和偏置后,所述方法还包括:
8.如权利要求1-4中任一项所述的方法,其特征在于,当所述待处理数据...
【专利技术属性】
技术研发人员:林岳,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。