一种网络模型构建方法以及相关设备技术

技术编号:40036005 阅读:35 留言:0更新日期:2024-01-16 18:59
本申请公开了一种网络模型构建方法以及相关设备,可以获取构建网络模型所需的参考样本;通过预设选择网络模型,对样本库中的多个样本进行样本选择处理,得到从所述样本库中筛选出的与所述参考样本相似的多个目标样本;通过所述预设选择网络模型,对所述专家模型库中的多个专家模型进行样本选择处理,得到从所述专家模型库中筛选出的所述训练样本与所述参考样本相似的多个目标专家模型;通过知识蒸馏处理,学习多个所述目标专家模型的模型信息,以得到融合后专家模型;基于所述参考样本以及所述目标样本,对所述融合后专家模型进行网络模型训练,得到训练后的目标网络模型。本申请可以提高网络模型的泛化性,增强网络模型效果。

【技术实现步骤摘要】

本申请涉及计算机,具体涉及一种网络模型构建方法以及相关设备


技术介绍

1、在实际业务中客户有不同的网络模型构建需要,但不同场景的样本往往不足,目前一般会采取收集更多的有标签样本进行建模或利用迁移学习从其他相似场景的样本中迁移出有用的知识给到客户场景的方法解决此问题。但是有标签样本收集周期长,真实业务场景通常等不了这么久,很难达成;迁移学习通常采用多个相似场景的样本直接混合训练通用模型的方式,导致网络模型的泛化性低,不利于增强网络模型效果。


技术实现思路

1、本申请实施例提供一种网络模型构建方法以及相关设备,相关设备可以包括网络模型构建装置、电子设备、计算机可读存储介质和计算机程序产品,用于提高网络模型的泛化性,增强网络模型效果。

2、本申请实施例提供一种网络模型构建方法,包括:

3、获取构建网络模型所需的参考样本;

4、以所述参考样本为基准,通过预设选择网络模型,对样本库中的多个样本进行样本选择处理,得到从所述样本库中筛选出的与所述参考样本相似的多个目标样本;

...

【技术保护点】

1.一种网络模型构建方法,其特征在于,包括:

2.根据权利要求1所述的网络模型构建方法,其特征在于,所述以所述参考样本为基准,通过预设选择网络模型,对样本库中的多个样本进行样本选择处理,得到从所述样本库中筛选出的与所述参考样本相似的多个目标样本,包括:

3.根据权利要求2所述的网络模型构建方法,其特征在于,所述对所述候选样本进行下采样,得到与所述参考样本相似的多个目标样本,所述候选样本中包括多个样本集合,包括:

4.根据权利要求1所述的网络模型构建方法,其特征在于,所述以所述参考样本为基准,通过所述预设选择网络模型,基于专家模型库中多个专家模型在训练时...

【技术特征摘要】

1.一种网络模型构建方法,其特征在于,包括:

2.根据权利要求1所述的网络模型构建方法,其特征在于,所述以所述参考样本为基准,通过预设选择网络模型,对样本库中的多个样本进行样本选择处理,得到从所述样本库中筛选出的与所述参考样本相似的多个目标样本,包括:

3.根据权利要求2所述的网络模型构建方法,其特征在于,所述对所述候选样本进行下采样,得到与所述参考样本相似的多个目标样本,所述候选样本中包括多个样本集合,包括:

4.根据权利要求1所述的网络模型构建方法,其特征在于,所述以所述参考样本为基准,通过所述预设选择网络模型,基于专家模型库中多个专家模型在训练时所应用的训练样本,对所述专家模型库中的多个专家模型进行样本选择处理,得到从所述专家模型库中筛选出的所述训练样本与所述参考样本相似的多个目标专家模型,包括:

5.根据权利要求1所述的网络模型构建方法,其特征在于,所述通过知识蒸馏处理,学习多个所述目标专家模型的模型信息,以得到融合后专家模型,包括:

6.根据权利要求5所述的网络模型构建方法,其特征在于,所述基于多个所述目标专家模型针对所述参考样本的预测...

【专利技术属性】
技术研发人员:郭清宇欧阳天雄何茂亮李超
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1