当前位置: 首页 > 专利查询>清华大学专利>正文

训练样本集生成方法、深度生成模型的训练方法和装置制造方法及图纸

技术编号:28422402 阅读:33 留言:0更新日期:2021-05-11 18:30
提供了一种训练样本集生成方法、深度生成模型的训练方法和装置。训练样本集生成时将原始样本集划分为多个随机性较弱的聚合样本集,并基于所述聚合样本集构建训练样本集。模型训练时采用所述训练样本集作为第一训练样本集;基于所述训练样本集和预设方式对所述深度生成模型进行迭代训练,直到达到预设条件,在每个迭代轮次中:从所述训练样本集中采样一个聚合训练样本集;基于所述聚合训练样本集中的每一个训练样本从所述深度生成模型采样生成对应的第三样本集;将所述聚合训练样本集和所述第三样本集的最大均值差异作为损失函数进行优化,以更新深度生成模型的参数。由此,在训练模型时,对样本集采取了先划分,后匹配的方法,模型生成效果更佳。

【技术实现步骤摘要】
训练样本集生成方法、深度生成模型的训练方法和装置
本专利技术的实施方式涉及神经网络
,更具体地,本专利技术的实施方式涉及一种训练样本集生成方法、深度生成模型的训练方法和装置。
技术介绍
本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。深度生成模型对于不确定性建模取得了很大的成功,在诸如图像生成、缺失数据补以及转化学习等任务中取得了很广泛的应用。
技术实现思路
在本上下文中,本专利技术的实施方式期望提供一种训练样本集生成方法、深度生成模型的训练方法和装置。在本专利技术实施方式的第一方面中,提供了一种训练样本集生成方法,包括:提供包括多个样本的原始样本集;基于各个样本的能够表示随机性的特定关联信息对所述原始样本集进行划分,将具有相同或相似特定关联信息的样本划分到同一集合中,得到多个聚合样本集,每一聚合样本集均为所述原始样本集的真子集;基于所述多个聚合样本集构建训练样本集。在本实施方式的一个实施例中,基于各个样本文档来自技高网...

【技术保护点】
1.一种训练样本集生成方法,包括/n提供包括多个样本的原始样本集;/n基于各个样本的能够表示随机性的特定关联信息对所述原始样本集进行划分,将具有相同或相似特定关联信息的样本划分到同一集合中,得到多个聚合样本集,每一聚合样本集均为所述原始样本集的真子集;/n基于所述多个聚合样本集构建训练样本集。/n

【技术特征摘要】
1.一种训练样本集生成方法,包括
提供包括多个样本的原始样本集;
基于各个样本的能够表示随机性的特定关联信息对所述原始样本集进行划分,将具有相同或相似特定关联信息的样本划分到同一集合中,得到多个聚合样本集,每一聚合样本集均为所述原始样本集的真子集;
基于所述多个聚合样本集构建训练样本集。


2.如权利要求1所述的训练样本集生成方法,其中,基于各个样本的能够表示随机性的特定关联信息对所述原始样本集进行划分,将具有相同或相似特定关联信息的样本划分到同一集合中,得到多个聚合样本集,包括:
从预先准备好的多个随机变量中采样得到任一随机变量;
基于所述随机变量从所述原始样本集中采样得到多个样本划分到同一集合中,得到一聚合样本集;
重复执行以上步骤,直到预设终止条件,在达到预设终止条件时,得到多个聚合样本集。


3.如权利要求2所述的训练样本集生成方法,其中,所述预设终止条件包括以下之一:
采样到所有随机变量;
所有样本均被划分至某个集合中;
重复执行预设次数。


4.一种深度生成模型的训练方法,包括:
采用权利要求1-3中任一项的方法提供训练样本集作为第一训练样本集;
基于所述训练样本集和预设方式对所述深度生成模型进行迭代训练,直到达到预设条件,在每个迭代轮次中:
从所述训练样本集中采样一个聚合训练样本集;
基于所述聚合训练样本集中的每一个训练样本从所述深度生成模型采样生成对应的第三样本集;
将所述聚合训练样本集和所述第三样本集的最大均值差异作为损失函数进行优化,以更新所述深度生成模型的参数。


5.一种训练样本集生成装置,包括
提供模块,被配置为提供包括多个样本的原始样本集;
划分模块,被配置为基于各个样本的能够表示随机性的特定关联信息对所述原始样本集进行划分,...

【专利技术属性】
技术研发人员:朱军任勇
申请(专利权)人:清华大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1