模型融合方法、装置、设备及存储介质制造方法及图纸

技术编号:34536042 阅读:22 留言:0更新日期:2022-08-13 21:30
本申请公开了一种模型融合方法、装置、设备及存储介质,属于数据处理领域。该方法包括:利用获取的多个分类模型、验证样本集合和分类预期要求,计算得到分类模型的分类精度;根据分类精度,选取第一目标分类模型和第二目标分类模型;基于第一目标分类模型对验证样本集合的分类分数和分类预期要求,确定第一分类分数区间和第二分类分数区间,并生成融合模型,第一分类分数区间包括第一目标分类模型的分类阈值,融合模型的规则包括:分类分数位于第一分类分数区间的数据的分类结果基于第二目标分类模型得到,分类分数位于第二分类分数区间的数据的分类基于第一目标分类模型得到。根据本申请实施例能够提高分类的准确性。本申请实施例能够提高分类的准确性。本申请实施例能够提高分类的准确性。

【技术实现步骤摘要】
模型融合方法、装置、设备及存储介质


[0001]本申请属于数据处理领域,尤其涉及一种模型融合方法、装置、设备及存储介质。

技术介绍

[0002]随着计算机技术的不断发展,越来越多领域中的检测判断类工作不再人工进行,而由计算机设备完成。例如,可预先建立分类模型,利用分类模型进行检测判断类工作。但由于检测判断类工作能够参考的因素较多,每种因素对分类模型分类的准确性的影响的差异也较大。因此,虽然研发出的分类模型种类众多,但难以进一步提高分类模型分类的准确性。

技术实现思路

[0003]本申请实施例提供一种模型融合方法、装置、设备及存储介质,能够提高分类的准确性。
[0004]第一方面,本申请实施例提供一种模型融合方法,包括:利用获取的多个分类模型、验证样本集合和分类预期要求,计算得到分类模型的分类精度;根据分类精度,选取第一目标分类模型和第二目标分类模型,第一目标分类模型为分类精度最高的分类模型,第二目标分类模型与目标分类模型与第一目标分类模型不同;基于第一目标分类模型对验证样本集合的分类分数和分类预期要求,确定第一分类分数区本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种模型融合方法,其特征在于,包括:利用获取的多个分类模型、验证样本集合和分类预期要求,计算得到分类模型的分类精度;根据所述分类精度,选取第一目标分类模型和第二目标分类模型,所述第一目标分类模型为所述分类精度最高的分类模型,所述第二目标分类模型与所述目标分类模型与所述第一目标分类模型不同;基于所述第一目标分类模型对所述验证样本集合的分类分数和所述分类预期要求,确定第一分类分数区间和所述第二分类分数区间,并生成融合模型,所述第一分类分数区间包括所述第一目标分类模型的分类阈值,所述第二分类分数区间为所述第一分类分数区间的补集,其中,所述融合模型的规则包括:分类分数位于所述第一分类分数区间的数据的分类结果基于所述第二目标分类模型得到,分类分数位于所述第二分类分数区间的数据的分类基于所述第一目标分类模型得到。2.根据权利要求1所述的方法,其特征在于,所述根据所述分类精度,选取第一目标分类模型和第二目标分类模型,包括:按照所述分类精度由高至低的顺序选取前N个分类模型,N为大于1的整数;在所述前N个分类模型中,选取所述分类精度最高的分类模型作为所述第一目标分类模型,其他分类模型作为候选模型;基于所述候选模型对所述验证样本集合处理的分类结果与所述第一目标分类模型对所述验证样本集合处理的分类结果,分别计算各所述候选模型与所述第一目标分类模型的相关性参数;选取相关性参数低于等于预设关联阈值且分类精度最高的所述候选模型作为所述第二目标分类模型。3.根据权利要求2所述的方法,其特征在于,所述基于所述候选模型对所述验证样本集合处理的分类结果与所述第一目标分类模型对所述验证样本集合处理的分类结果,分别计算各所述候选模型与所述第一目标分类模型的相关性参数,包括:基于所述候选模型对所述验证样本集合处理的分类结果与所述第一目标分类模型对所述验证样本集合处理的分类结果,分别计算各所述候选模型与所述第一目标分类模型的协方差;根据所述协方差,计算各所述候选模型与所述第一目标分类模型的所述相关性参数。4.根据权利要求1所述的方法,其特征在于,所述基于所述第一目标分类模型对所述验证样本集合的分类分数和所述分类预期要求,确定第一分类分数区间和所述第二分类分数区间,并生成融合模型,包括:根据所述第一目标分类模型对所述验证样本集合处理的分类分数,统计所述验证样本集合中与各分类分数对应的样本数量;基于所述第一目标分类模型对所述验证样本集合的分类分数和所述分类预期要求,确定所述第一目标分类模型的分类阈值,所述分类预期要求与正样本通过率、负样本拦截率相关;根据所述第一目标分类模型的分类阈值、所述验证样本集合中与各分类分数对应的样
本数量,确定所述第一分类分数区间和所述第二分类分数区间,并生成所述融合模型,所述第一分类分数区间和所述第二分类分数区间使所述融合模型的分类精度最高。5.根据权利要求4所述的方法,其特征在于,所述样本数量包括正样本数量和负样本数量,所述根据所述第一目标分类模型的分类阈值、所述验证样本集合中与各分类分数对应的样本数量,确定所述第一分类分数区间和所述第二分类分数区间,并生成所述融合模型,包括:根据所述第一目标分类模型的分类阈值和所述样本数量,确定初始分类分数区间,所述初始分类分数区间包括所述第一目标分类模型的分类阈值,分类分数位于所述初始分类分数区间的样本的分布特性与所述验证样本集合中样本的分布特性一致;逐次缩小所述初始分类分数区间,使分类分数位于每次缩小后的所述初始分类分数区间的样本的分布特性与所述验证样本集合中样本的分布特性一致;根据每次缩小后的所述初始分类分数区间和所述融合模型的规则,确定所述第一分类分数区间和所述第二分类分数区间,并生成所述融合模型。6.根据权利要求5所述的方法,其特征在于,所述根据每次缩小后的所述初始分类分数区间和所述融合模型的规则,确定所述第一分类分数区间和所述第二分类分数区间,并生成所述融合模型,包括:根据每次缩小后的所述初始分类分数区间,生成初始融合模型;基于每次缩小后的所述初始分类分数区间和所述融合模型的规则,计算所述初始融合模型处理所述验证样本集合的分类精度,直至所述初始融合模型处理所述验证样本集合的分类精度达到最大值;将分类精度达到最大值的所述初始融合模型中的所述初始分类分数区间确定为所述第一分...

【专利技术属性】
技术研发人员:窦逸辛卞凯柴培林赖嘉伟王锟朋
申请(专利权)人:中国银联股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1