The invention relates to the field of deep learning technology, in particular to a method and device for generating small samples based on antagonistic generation network, aiming at solving the technical problem of how to generate sample data using antagonistic generation network in the case of a small amount of sample data. To this end, the small sample generation method based on the countermeasure generation network provided by the present invention can generate samples corresponding to small sample types based on the countermeasure generation network and according to random noise and label information. In this process, the invention adopts the method of migration learning and batch training to train the antagonistic generating network, so that the generated antagonistic network can be effectively migrated and applied to the task of generating a few antagonistic generating network samples.
【技术实现步骤摘要】
基于对抗生成网络的小样本生成方法及装置
本专利技术涉及深度学习
,具体涉及一种基于对抗生成网络的小样本生成方法及装置。
技术介绍
基于深度学习技术构建的神经网络模型通常需要使用大量样本数据完成模型训练。然而,某些特定类型的目标样本数据往往难以获取或无法获取。例如,人脸表情数据和特殊图像数据等。目前,可以利用生成对抗网络技术生成特定类型的目标样本数据,但是生成对抗网络也必要使用大量的样本数据完成网络训练后才能生成较为准确的目标样本数据。
技术实现思路
为了解决现有技术中的上述问题,即为了解决如何在少量样本数据的情况下利用生成对抗网络生成样本数据的技术问题。为此目的,本专利技术提供了一种基于对抗生成网络的小样本生成方法及装置。在第一方面,本专利技术中的基于对抗生成网络的小样本生成方法包括如下步骤:获取符合预设数据分布的随机噪声以及预设的小样本类型对应的标签信息;基于预先构建的对抗生成网络并根据所述随机噪声和标签信息,生成所述小样本类型对应的样本;其中,所述对抗生成网络是基于卷积神经网络并利用机器学习算法所构建的网络,所述方法还包括按照下列步骤对所述对抗生成网络进行网络训练:利用所述机器学习算法并根据预设的源数据集对所述对抗生成网络进行网络训练,得到第一对抗生成网络;利用所述机器学习算法并根据预设的目标数据集对所述第一对抗生成网络进行网络训练,得到第二对抗生成网络;并且其中,所述源数据集中源数据的数量远大于所述目标数据集中目标数据的数量。进一步地,本专利技术提供的一个优选技术方案是:所述对抗生成网络包括生成网络和对抗网络;所述生成网络被配置为根据所述随机噪声和 ...
【技术保护点】
1.一种基于对抗生成网络的小样本生成方法,其特征在于包括:获取符合预设数据分布的随机噪声以及预设的小样本类型对应的标签信息;基于预先构建的对抗生成网络并根据所述随机噪声和标签信息,生成所述小样本类型对应的样本;其中,所述对抗生成网络是基于卷积神经网络并利用机器学习算法所构建的网络,所述方法还包括按照下列步骤对所述对抗生成网络进行网络训练:利用所述机器学习算法并根据预设的源数据集对所述对抗生成网络进行网络训练,得到第一对抗生成网络;利用所述机器学习算法并根据预设的目标数据集对所述第一对抗生成网络进行网络训练,得到第二对抗生成网络;并且其中,所述源数据集中源数据的数量远大于所述目标数据集中目标数据的数量。
【技术特征摘要】
1.一种基于对抗生成网络的小样本生成方法,其特征在于包括:获取符合预设数据分布的随机噪声以及预设的小样本类型对应的标签信息;基于预先构建的对抗生成网络并根据所述随机噪声和标签信息,生成所述小样本类型对应的样本;其中,所述对抗生成网络是基于卷积神经网络并利用机器学习算法所构建的网络,所述方法还包括按照下列步骤对所述对抗生成网络进行网络训练:利用所述机器学习算法并根据预设的源数据集对所述对抗生成网络进行网络训练,得到第一对抗生成网络;利用所述机器学习算法并根据预设的目标数据集对所述第一对抗生成网络进行网络训练,得到第二对抗生成网络;并且其中,所述源数据集中源数据的数量远大于所述目标数据集中目标数据的数量。2.根据权利要求1所述的基于对抗生成网络的小样本生成方法,其特征在于,所述对抗生成网络包括生成网络和对抗网络;所述生成网络被配置为根据所述随机噪声和标签信息生成对抗样本;所述对抗网络被配置为根据所述对抗样本及其标签信息,获取所述对抗样本的真实概率;相应的,“基于预先构建的对抗生成网络并根据所述随机噪声和标签信息,生成所述小样本类型对应的样本”的步骤包括选取所述真实概率大于等于预设概率阈值的对抗样本作为所述小样本类型对应的样本。3.根据权利要求2所述的基于对抗生成网络的样本生成方法,其特征在于,“利用所述机器学习算法并根据预设的源数据集对所述对抗生成网络进行网络训练,得到第一对抗生成网络”的步骤包括:步骤S11:根据预设的第一训练批量获取所述源数据集中的源数据;步骤S12:利用所述机器学习算法并根据所述源数据对所述对抗生成网络中的生成网络进行网络迭代训练,并根据所述源数据和所述生成网络的生成数据,对所述对抗生成网络中的对抗网络进行网络训练;步骤S13:重复执行步骤S11~步骤S12并且当所述生成网络的生成数据满足预设的数据要求时停止训练。4.根据权利要求3所述基于对抗生成网络的样本生成方法,其特征在于,“利用所述机器学习算法并根据所述源数据对所述对抗生成网络中的生成网络进行网络迭代训练”的步骤包括:步骤S121:获取每个源数据对应的标签信息和随机噪声,并且对所述每个源数据对应的标签信息和随机噪声进行数据拼接得到第一拼接数据;步骤S122:利用所述机器学习算法并根据所述第一拼接数据对所述对抗生成网络中的生成网络进行网络训练;步骤S123:重复执行步骤S121~步骤S122并且当所述生成网络的生成数据满足预设的数据要求时停止训练。5.根据权利要求4所述基于对抗生成网络的样本生成方法,其特征在于,“根据所述源数据和所述生成网络的生成数据,对所述对抗生成网络中的对抗网络进行网络训练”的...
【专利技术属性】
技术研发人员:李扬曦,杜翠兰,井雅琪,佟玲玲,张翠,胡卫明,李文娟,薛建明,
申请(专利权)人:国家计算机网络与信息安全管理中心,中国科学院自动化研究所,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。