System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 模型训练方法、装置、电子设备及计算机存储介质制造方法及图纸_技高网

模型训练方法、装置、电子设备及计算机存储介质制造方法及图纸

技术编号:40701922 阅读:2 留言:0更新日期:2024-03-22 11:00
本申请实施例公开了一种模型训练方法、装置、电子设备及计算机存储介质;在本申请实施例中,获取待训练模型的数据集,所述数据集包括至少两种来源的训练数据;对每种所述来源的所述训练数据进行特征提取,得到每种所述来源的所述训练数据对应的样本特征;根据每种所述来源的所述训练数据对应的样本特征,确定所述待训练模型针对每种所述来源的损失值;根据每种所述来源的损失值,对所述待训练模型进行训练,得到所述待训练模型训练完成的目标模型。本申请实施例可以提高待训练模型的训练效果。

【技术实现步骤摘要】

本申请涉及神经网络模型,具体涉及一种模型训练方法、装置、电子设备及计算机存储介质


技术介绍

1、随着科学技术的发展,神经网络模型的应用越来越广泛。在使用神经网络模型之前,需要根据数据对神经网络模型进行训练。神经网络模型的训练包括有监督训练和无监督训练。当有监督训练神经网络模型时,需要对数据进行标注。

2、目前数据存在不同的数据来源,不同数据来源的数据对应的标识可能相同,此时,需要将相同标识的数据进行聚类合并后再进行标注和训练,但是,这样会导致引入噪声,使得神经网络模型的训练效果较差。


技术实现思路

1、本申请实施例提供一种模型训练方法、装置、电子设备及计算机存储介质,可以解决神经网络模型的训练效果较差的技术问题。

2、本申请实施例提供一种模型训练方法,包括:

3、获取待训练模型的数据集,上述数据集包括至少两种来源的训练数据;

4、对每种上述来源的上述训练数据进行特征提取,得到每种上述来源的上述训练数据对应的样本特征;

5、根据每种上述来源的上述训练数据对应的样本特征,确定上述待训练模型针对每种上述来源的损失值;

6、根据每种上述来源的损失值,对上述待训练模型进行训练,得到上述待训练模型训练完成的目标模型。

7、相应地,本申请实施例提供一种模型训练装置,包括:

8、获取模块,用于获取待训练模型的数据集,上述数据集包括至少两种来源的训练数据;

9、提取模块,用于对每种上述来源的上述训练数据进行特征提取,得到每种上述来源的上述训练数据对应的样本特征;

10、确定模块,用于根据每种上述来源的上述训练数据对应的样本特征,确定上述待训练模型针对每种上述来源的损失值;

11、训练模块,用于根据每种上述来源的损失值,对上述待训练模型进行训练,得到上述待训练模型训练完成的目标模型。

12、此外,本申请实施例还提供一种电子设备,包括处理器和存储器,上述存储器存储有计算机程序,上述处理器用于运行上述存储器内的计算机程序实现本申请实施例提供的模型训练方法。

13、此外,本申请实施例还提供一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序适于处理器进行加载,以执行本申请实施例所提供的任一种模型训练方法。

14、此外,本申请实施例还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现本申请实施例所提供的任一种模型训练方法。

15、在本申请实施例中,获取待训练模型的数据集,数据集包括至少两种来源的训练数据;对每种来源的训练数据进行特征提取,得到每种来源的训练数据对应的样本特征;根据每种来源的训练数据对应的样本特征,确定待训练模型针对每种来源的损失值;根据每种来源的损失值,对待训练模型进行训练,得到待训练模型训练完成的目标模型,实现根据每种来源的训练数据计算每种来源对应的损失值,并根据每种来源的损失值,对待训练模型进行训练,使得无需对不同来源的训练数据进行聚类合并,不会引入噪声,降低聚类合并的工作量,提高对待训练模型的训练效率和训练效果。

本文档来自技高网...

【技术保护点】

1.一种模型训练方法,其特征在于,包括:

2.根据权利要求1所述的模型训练方法,其特征在于,所述根据每种所述来源的损失值,对所述待训练模型进行训练,得到所述待训练模型训练完成的目标模型,包括:

3.根据权利要求2所述的模型训练方法,其特征在于,所述获取每种所述来源对应的更新顺序,包括:

4.根据权利要求2所述的模型训练方法,其特征在于,所述获取每种所述来源对应的更新顺序,包括:

5.根据权利要求1所述的模型训练方法,其特征在于,所述获取待训练模型的数据集,包括:

6.根据权利要求5所述的模型训练方法,其特征在于,所述对所述候选来源对应的训练数据进行增量处理,得到所述候选来源的调整后训练数据,包括:

7.根据权利要求5所述的模型训练方法,其特征在于,所述对所述候选来源对应的训练数据进行增量处理,得到所述候选来源的调整后训练数据,包括:

8.一种模型训练装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有计算机程序,所述处理器用于运行所述存储器内的计算机程序,以执行权利要求1至7任一项所述的模型训练方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行权利要求1至7任一项所述的模型训练方法。

...

【技术特征摘要】

1.一种模型训练方法,其特征在于,包括:

2.根据权利要求1所述的模型训练方法,其特征在于,所述根据每种所述来源的损失值,对所述待训练模型进行训练,得到所述待训练模型训练完成的目标模型,包括:

3.根据权利要求2所述的模型训练方法,其特征在于,所述获取每种所述来源对应的更新顺序,包括:

4.根据权利要求2所述的模型训练方法,其特征在于,所述获取每种所述来源对应的更新顺序,包括:

5.根据权利要求1所述的模型训练方法,其特征在于,所述获取待训练模型的数据集,包括:

6.根据权利要求5所述的模型训练方法,其特征在于,所述对所述候选来源对应的训练数据进行...

【专利技术属性】
技术研发人员:张威
申请(专利权)人:小红书科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1