【技术实现步骤摘要】
数据的分类方法、装置、设备、介质及程序产品
[0001]本申请涉及人工智能领域,特别涉及一种数据的分类方法、装置、设备、介质及程序产品。
技术介绍
[0002]将深度神经网络模型(Deep neural network,DNN)应用在大部分业务场景通常遵循如下的常规流程:训练数据收集;利用训练数据对神经网络模型的网络参数进行训练;对训练好的神经网络模型部署于实际业务场景,并以测试样本作为输入,由训练好的神经网络模型输出对应的决策结果。上述方式类似于“闭卷”考试,即在已有训练集合学习,但是训练完成就丢弃掉训练数据直接利用神经网络在新样本上测试。
[0003]相关技术中,通过在测试阶段引入额外的记忆力机制能实现“开卷”考试的效果,从而提升模型的预测性能。其实现为除开模型本身的预测结果之外,可以通过查询测试样本在原始训练集合中特征相似的训练样本,并将这些近邻的训练样本的标签信息与模型的预测信息融合得到增强的预测结果。
[0004]上述方式通常假设训练集和测试数据通常来自同一数据分布,而在实际业务场景中,训练样本与测 ...
【技术保护点】
【技术特征摘要】
1.一种数据的分类方法,其特征在于,所述方法包括:获取待分类数据、多个训练样本数据以及通过所述多个训练样本数据训练训练得到的目标分类模型,所述训练样本数据标注有第一标签,所述第一标签用于指示所述训练样本数据的分类类别;将所述待分类数据输入所述目标分类模型中进行分类预测,输出得到所述待分类数据对应的第一分类结果;基于所述多个训练样本数据中各训练样本数据之间的组合结果,得到多个训练数据组,所述训练数据组中包括至少两个训练样本数据,所述训练数据组对应有第二标签,所述第二标签由所述至少两个训练样本数据的所述第一标签融合得到;基于所述多个训练数据组中与所述待分类数据关联的至少一个目标训练数据组的第二标签,得到所述待分类数据对应的第二分类结果;基于所述第一分类结果和所述第二分类结果的融合情况,得到所述待分类数据对应的目标分类结果。2.根据权利要求1所述的方法,其特征在于,所述基于所述多个训练数据组中与所述待分类数据关联的至少一个目标训练数据组的第二标签,得到所述待分类数据对应的第二分类结果,包括:基于所述待分类数据和所述训练数据组之间的相似度,从所述多个训练数据中确定所述目标训练数据组;响应于存在多个目标训练数据组,对所述多个目标训练数据组对应的所述第二标签进行标签融合,得到所述第二分类结果。3.根据权利要求2所述的方法,其特征在于,所述基于所述待分类数据和所述训练数据组之间的特征相似度,从所述多个训练数据中确定所述目标训练数据组,包括:基于所述训练数据组对应的所述至少两个训练样本数据获取所述训练数据组对应的数据组特征表示;通过所述目标分类模型对所述待分类数据进行特征提取,得到所述待分类数据对应的数据特征表示;基于所述数据组特征表示和所述数据特征表示在特征空间中的距离确定所述待分类数据和所述训练数据组之间的特征相似度;将所述特征相似度满足预设筛选条件的训练数据组确定为所述目标训练数据组。4.根据权利要求3所述的方法,其特征在于,所述基于所述训练数据组对应的所述至少两个训练样本数据获取所述训练数据组对应的数据组特征表示,包括:通过所述目标分类模型对所述至少两个训练样本数据分别进行特征提取,得到所述训练样本数据对应的训练特征表示;获取所述训练数据组对应的第一融合权重关系,所述第一融合权重关系用于指示所述训练数据组中至少两个训练样本数据进行特征融合时分别对应的权重;基于所述第一融合权重关系对所述训练数据组中各训练样本数据对应的训练特征表示进行加权求和,得到所述数据组特征表示。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:获取所述训练数据组中所述至少两个训练样本数据分别对应的所述第一标签的第一
标签编码表示;基于所述第一融合权重关系对所述训练数据组对应的多个第一标签编码表示进行加权求和,得到所述训练数据组对应的所述第二标签。6.根据权利要求3至5任一所述的方法,其特征在于,所述响应于存在多个目标训练数据组,对所述多个目标训练数据组对应的所述第二标签进行标签融合,得到所述第二分类结果,包括:将所述目标训练数据组和所述待分类数据对应的所述特征相似度转化为目标权重;获取所述目标训练数据组的第二标签对应的第二标签编码表示;基于所述目标权重对所述多个目标训练数据组对应的第二标签编码表示进行加权求和,得...
【专利技术属性】
技术研发人员:吴秉哲,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。