System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 样本增强方法、装置、电子设备及计算机存储介质制造方法及图纸_技高网

样本增强方法、装置、电子设备及计算机存储介质制造方法及图纸

技术编号:40703857 阅读:6 留言:0更新日期:2024-03-22 11:03
本申请实施例公开了一种样本增强方法、装置、电子设备及计算机存储介质;在本申请实施例中,获取包括多个训练样本的训练集,每个所述训练样本包括至少两种模态信息;从至少两种所述模态信息中筛选出所述训练样本的待增强的模态信息,得到目标模态信息;对所述训练样本的所述目标模态信息进行数据增强处理,得到所述训练样本对应的增强后训练样本;根据所述训练样本和所述增强后训练样本,确定所述训练集对应的增强后训练集,所述增强后训练集用于训练待训练模型。本申请实施例可以提高构造增强后训练样本的多样性,从而提高根据增强后训练样本训练到的模型的泛化能力。

【技术实现步骤摘要】

本申请涉及数据处理,具体涉及一种样本增强方法、装置、电子设备及计算机存储介质


技术介绍

1、随着科学技术的发展,神经网络模型的应用越来越广泛,比如将神经网络模型用于分类或推荐。在采用神经网络模型之前,需要采用训练样本对神经网络模型进行训练。由于训练样本的数量通常有限,因此,会对训练样本进行数据增强处理,从而增加训练样本的数量。

2、然而,根据目前的数据增强方法得到的训练样本训练神经网络模型时,会导致训练得到的神经网络模型的泛化能力较低。


技术实现思路

1、本申请实施例提供一种样本增强方法、装置、电子设备及计算机存储介质,可以解决神经网络模型的泛化能力较低的技术问题。

2、本申请实施例提供一种样本增强方法,包括:

3、获取包括多个训练样本的训练集,每个上述训练样本包括至少两种模态信息;

4、从至少两种上述模态信息中筛选出上述训练样本的待增强的模态信息,得到目标模态信息;

5、对上述训练样本的上述目标模态信息进行数据增强处理,得到上述训练样本对应的增强后训练样本;

6、根据上述训练样本和上述增强后训练样本,确定上述训练集对应的增强后训练集,上述增强后训练集用于训练待训练模型。

7、相应地,本申请实施例提供一种样本增强装置,包括:

8、获取模块,用于获取包括多个训练样本的训练集,每个上述训练样本包括至少两种模态信息;

9、筛选模块,用于从至少两种上述模态信息中筛选出上述训练样本的待增强的模态信息,得到目标模态信息;

10、增强模块,用于对上述训练样本的上述目标模态信息进行数据增强处理,得到上述训练样本对应的增强后训练样本;

11、确定模块,用于根据上述训练样本和上述增强后训练样本,确定上述训练集对应的增强后训练集,上述增强后训练集用于训练待训练模型。

12、此外,本申请实施例还提供一种电子设备,包括处理器和存储器,上述存储器存储有计算机程序,上述处理器用于运行上述存储器内的计算机程序实现本申请实施例提供的样本增强方法。

13、此外,本申请实施例还提供一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序适于处理器进行加载,以执行本申请实施例所提供的任一种样本增强方法。

14、此外,本申请实施例还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现本申请实施例所提供的任一种样本增强方法。

15、在本申请实施例中,获取包括多个训练样本的训练集,每个训练样本包括至少两种模态信息;从至少两种模态信息中筛选出训练样本的待增强的模态信息,得到目标模态信息;对训练样本的目标模态信息进行数据增强处理,得到训练样本对应的增强后训练样本;根据训练样本和增强后训练样本,确定训练集对应的增强后训练集,增强后训练集用于训练待训练模型,实现对不同训练样本的不同模态信息进行数据增强,提高构造增强后训练样本的多样性,从而使得后续根据增强后训练集训练待训练模型得到的目标模型的泛化能力更高。

本文档来自技高网...

【技术保护点】

1.一种样本增强方法,其特征在于,包括:

2.根据权利要求1所述的样本增强方法,其特征在于,所述从至少两种所述模态信息中筛选出所述训练样本的待增强的模态信息,得到目标模态信息,包括:

3.根据权利要求1所述的样本增强方法,其特征在于,所述从至少两种所述模态信息中筛选出所述训练样本的待增强的模态信息,得到目标模态信息,包括:

4.根据权利要求1所述的样本增强方法,其特征在于,所述从至少两种所述模态信息中筛选出所述训练样本的待增强的模态信息,得到目标模态信息,包括:

5.根据权利要求1-4任一项所述的样本增强方法,其特征在于,所述对所述训练样本的所述目标模态信息进行数据增强处理,得到所述训练样本对应的增强后训练样本,包括:

6.根据权利要求1-4任一项所述的样本增强方法,其特征在于,所述对所述训练样本的所述目标模态信息进行数据增强处理,得到所述训练样本对应的增强后训练样本,包括:

7.根据权利要求6所述的样本增强方法,其特征在于,所述从所述训练集中筛选出至少两个所述训练样本,得到第一训练样本和第二训练样本,包括:

8.一种样本增强装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有计算机程序,所述处理器用于运行所述存储器内的计算机程序,以执行权利要求1至7任一项所述的样本增强方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行权利要求1至7任一项所述的样本增强方法。

...

【技术特征摘要】

1.一种样本增强方法,其特征在于,包括:

2.根据权利要求1所述的样本增强方法,其特征在于,所述从至少两种所述模态信息中筛选出所述训练样本的待增强的模态信息,得到目标模态信息,包括:

3.根据权利要求1所述的样本增强方法,其特征在于,所述从至少两种所述模态信息中筛选出所述训练样本的待增强的模态信息,得到目标模态信息,包括:

4.根据权利要求1所述的样本增强方法,其特征在于,所述从至少两种所述模态信息中筛选出所述训练样本的待增强的模态信息,得到目标模态信息,包括:

5.根据权利要求1-4任一项所述的样本增强方法,其特征在于,所述对所述训练样本的所述目标模态信息进行数据增强处理,得到所述训练样本对应的增强后训练样本,包括:

6.根据权利要求...

【专利技术属性】
技术研发人员:耿思晴
申请(专利权)人:小红书科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1