【技术实现步骤摘要】
模型训练方法、样本生成方法、装置、电子设备及存储介质
本专利技术涉及计算机领域,尤其涉及一种模型训练方法、样本生成方法、装置、电子设备及存储介质。
技术介绍
大数据时代的到来和高性能计算设备(如GPU,TPU)的算力日益提升,使得人工智能取得了长足的发展。然而,现有的人工智能算法往往依赖大量的标注数据进行训练,比如:著名的数据集ImageNet中包含上千万张标注好类别的图片,每一张图片都是使用相机拍照,或者其他方式搜集而来,每一张图片由人工标注、核验,整个过程费时费力,且耗费大量的资金。
技术实现思路
为了解决上述技术问题或者至少部分地解决上述人工搜集训练样本时,每一张图片由人工标注、核验,整个过程费时费力,且耗费大量的资金的技术问题,本专利技术提供了一种模型训练方法、样本生成方法、装置、电子设备及存储介质。第一方面,本专利技术提供了一种模型训练方法,包括:在数据集中提取初始样本及与所述初始样本对应的类别标签;利用所述初始样本及所述类别标签,对预先建立的变分自编码器进行训练 ...
【技术保护点】
1.一种模型训练方法,其特征在于,包括:/n在数据集中提取初始样本及与所述初始样本对应的类别标签;/n利用所述初始样本及所述类别标签,对预先建立的变分自编码器进行训练,直至所述变分自编码器收敛,所述变分自编码器包括编码器和解码器;/n将所述变分自编码器中的解码器确定为用于生成训练样本的样本生成模型。/n
【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:
在数据集中提取初始样本及与所述初始样本对应的类别标签;
利用所述初始样本及所述类别标签,对预先建立的变分自编码器进行训练,直至所述变分自编码器收敛,所述变分自编码器包括编码器和解码器;
将所述变分自编码器中的解码器确定为用于生成训练样本的样本生成模型。
2.根据权利要求1所述的模型训练方法,其特征在于,利用所述初始样本及所述类别标签,对所述变分自编码器进行训练,包括:
将所述初始样本输入至所述变分自编码器的编码器,所述编码器输出特征向量;
将所述类别标签和所述特征向量输入至所述变分自编码器的解码器,所述解码器输出目标样本。
3.根据权利要求2所述的模型训练方法,其特征在于,训练所述变分自编码器的目标函数根据初始样本和所述目标样本之间的欧氏距离,以及,所述特征向量和随机噪声之间的散度确定。
4.根据权利要求1所述的模型训练方法,其特征在于,所述变分自编码器的编码器使用的神经网络为具有跳层连接结构的神经网络,所述跳层连接结构用于将所述神经网络的第N+1层的输入特征跳层连接至第M-N层,其中,M≥4,N≥1,N+1<M-N,利用第M-N层将第N+1层的输入特征与第M-N-1层的输出特征融合。
5.一种样本生成方法,其特征在于,包括:
获取待生成训练样本的类别信息及随机采样到的随机噪声;
将所述类别信息和所述随机噪声输入预设的样本生成模型,得到所述待生成训练样本,所述样本生成模型是利用权利要求1至4任一所述的模型训练方法训练的。
6.一种模型训练装置,其特征在于,包括:
提取模块,用于在数据集中提取初始样本及与所述初始样本对应的类别标签;
训练模块,用于利用所述初始样本及所述类别标签,对预先建立的变分自编码器进行训练,直至所述变分自编码器收敛,所述变分自编码器包括编码器和解码器;
确定模块...
【专利技术属性】
技术研发人员:郭晓锋,谭颖,李海,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。