基于对抗生成网络的小样本生成方法及装置制造方法及图纸

技术编号:20076120 阅读:25 留言:0更新日期:2019-01-15 00:56
本发明专利技术涉及深度学习技术领域,具体提供了一种基于对抗生成网络的小样本生成方法及装置,旨在解决如何在少量样本数据的情况下利用生成对抗网络生成样本数据的技术问题。为此目的,本发明专利技术提供的基于对抗生成网络的小样本生成方法能够基于对抗生成网络并根据随机噪声和标签信息,生成小样本类型对应的样本。在此过程中,本发明专利技术采用迁移学习和批量训练的方法对对抗生成网络进行网络训练,使生成对抗网络可以有效迁移应用于少量样本的对抗生成网络样本生成任务中。

Small Sample Generation Method and Device Based on Countermeasure Generation Network

The invention relates to the field of deep learning technology, in particular to a method and device for generating small samples based on antagonistic generation network, aiming at solving the technical problem of how to generate sample data using antagonistic generation network in the case of a small amount of sample data. To this end, the small sample generation method based on the countermeasure generation network provided by the present invention can generate samples corresponding to small sample types based on the countermeasure generation network and according to random noise and label information. In this process, the invention adopts the method of migration learning and batch training to train the antagonistic generating network, so that the generated antagonistic network can be effectively migrated and applied to the task of generating a few antagonistic generating network samples.

【技术实现步骤摘要】
基于对抗生成网络的小样本生成方法及装置
本专利技术涉及深度学习
,具体涉及一种基于对抗生成网络的小样本生成方法及装置。
技术介绍
基于深度学习技术构建的神经网络模型通常需要使用大量样本数据完成模型训练。然而,某些特定类型的目标样本数据往往难以获取或无法获取。例如,人脸表情数据和特殊图像数据等。目前,可以利用生成对抗网络技术生成特定类型的目标样本数据,但是生成对抗网络也必要使用大量的样本数据完成网络训练后才能生成较为准确的目标样本数据。
技术实现思路
为了解决现有技术中的上述问题,即为了解决如何在少量样本数据的情况下利用生成对抗网络生成样本数据的技术问题。为此目的,本专利技术提供了一种基于对抗生成网络的小样本生成方法及装置。在第一方面,本专利技术中的基于对抗生成网络的小样本生成方法包括如下步骤:获取符合预设数据分布的随机噪声以及预设的小样本类型对应的标签信息;基于预先构建的对抗生成网络并根据所述随机噪声和标签信息,生成所述小样本类型对应的样本;其中,所述对抗生成网络是基于卷积神经网络并利用机器学习算法所构建的网络,所述方法还包括按照下列步骤对所述对抗生成网络进行网络训练:利用所述机器学习算法并根据预设的源数据集对所述对抗生成网络进行网络训练,得到第一对抗生成网络;利用所述机器学习算法并根据预设的目标数据集对所述第一对抗生成网络进行网络训练,得到第二对抗生成网络;并且其中,所述源数据集中源数据的数量远大于所述目标数据集中目标数据的数量。进一步地,本专利技术提供的一个优选技术方案是:所述对抗生成网络包括生成网络和对抗网络;所述生成网络被配置为根据所述随机噪声和标签信息生成对抗样本;所述对抗网络被配置为根据所述对抗样本及其标签信息,获取所述对抗样本的真实概率;相应的,“基于预先构建的对抗生成网络并根据所述随机噪声和标签信息,生成所述小样本类型对应的样本”的步骤包括选取所述真实概率大于等于预设概率阈值的对抗样本作为所述小样本类型对应的样本。进一步地,本专利技术提供的一个优选技术方案是:“利用所述机器学习算法并根据预设的源数据集对所述对抗生成网络进行网络训练,得到第一对抗生成网络”的步骤包括:步骤S11:根据预设的第一训练批量获取所述源数据集中的源数据;步骤S12:利用所述机器学习算法并根据所述源数据对所述对抗生成网络中的生成网络进行网络迭代训练,并根据所述源数据和所述生成网络的生成数据,对所述对抗生成网络中的对抗网络进行网络训练;步骤S13:重复执行步骤S11~步骤S12并且当所述生成网络的生成数据满足预设的数据要求时停止训练。进一步地,本专利技术提供的一个优选技术方案是:“利用所述机器学习算法并根据所述源数据对所述对抗生成网络中的生成网络进行网络迭代训练”的步骤包括:步骤S121:获取每个源数据对应的标签信息和随机噪声,并且对所述每个源数据对应的标签信息和随机噪声进行数据拼接得到第一拼接数据;步骤S122:利用所述机器学习算法并根据所述第一拼接数据对所述对抗生成网络中的生成网络进行网络训练;步骤S123:重复执行步骤S121~步骤S122并且当所述生成网络的生成数据满足预设的数据要求时停止训练。进一步地,本专利技术提供的一个优选技术方案是:“根据所述源数据和所述生成网络的生成数据,对所述对抗生成网络中的对抗网络进行网络训练”的步骤包括:根据所述源数据和所述生成网络的生成数据构建第一对抗数据集;获取所述第一对抗数据集中的对抗数据及其标签信息并且对所述对抗数据和标签信息进行数据拼接得到第二拼接数据;利用所述机器学习算法并根据所述第二拼接数据对所述对抗生成网络中的对抗网络进行网络训练;其中,所述第一对抗数据集包括生成数据和源数据,并且所述生成数据与源数据的数量相同。进一步地,本专利技术提供的一个优选技术方案是:“利用所述机器学习算法并根据预设的目标数据集对所述第一对抗生成网络进行网络训练,得到第二对抗生成网络”的步骤包括:步骤S21:根据预设的第二训练批量获取所述目标数据集中的目标数据;步骤S22:利用所述机器学习算法并根据所述目标数据对所述对抗生成网络中的生成网络进行网络迭代训练,并根据所述目标数据和所述生成网络的生成数据,对所述对抗生成网络中的对抗网络进行网络训练;步骤S23:重复执行步骤S21~步骤S22并且当所述生成网络的生成数据满足预设的数据要求时停止训练。进一步地,本专利技术提供的一个优选技术方案是:“利用所述机器学习算法并根据所述目标数据对所述对抗生成网络中的生成网络进行网络迭代训练”的步骤包括:步骤S221:获取每个目标数据对应的标签信息和随机噪声,并且对所述每个目标数据对应的标签信息和随机噪声进行数据拼接得到第三拼接数据;步骤S222:利用所述机器学习算法并根据所述第三拼接数据对所述第一对抗生成网络中的生成网络进行网络训练;步骤S223:重复执行步骤S221~步骤S222并且当所述生成网络的生成数据满足预设的数据要求时停止训练。进一步地,本专利技术提供的一个优选技术方案是:“根据所述目标数据和所述生成网络的生成数据,对所述对抗生成网络中的对抗网络进行网络训练”的步骤包括:根据所述目标数据和所述生成网络的生成数据构建第二对抗数据集;获取所述第二对抗数据集中的对抗数据及其标签信息并且对所述对抗数据和标签信息进行数据拼接得到第四拼接数据;利用所述机器学习算法并根据所述第四拼接数据对所述第一对抗生成网络中的对抗网络进行网络训练;其中,所述第二对抗数据集包括生成数据和目标数据,并且所述生成数据与目标数据的数量相同。在第二方面,本专利技术中的存储装置存储有多条程序,所述程序适于由处理器加载以执行上述技术方案中任一项技术方案所述的基于对抗生成网络的样本生成方法。在第三方面,本专利技术中的控制装置,包括处理器和存储设备,所述存储设备适于存储多条程序,所述程序适于由所述处理器加载以执行上述技术方案中任一项技术方案所述的基于对抗生成网络的样本生成方法。与最接近的现有技术相比,上述技术方案至少具有如下有益效果:本专利技术提供的基于对抗生成网络的小样本生成方法的主要步骤是:首先获取随机噪声和标签信息,然后基于对抗生成网络并根据随机噪声和标签信息,生成小样本类型对应的样本。具体地,本专利技术采用迁移学习和批量训练的方法对对抗生成网络进行网络训练,使生成对抗网络可以有效迁移应用于少量样本的对抗生成网络样本生成任务中。附图说明图1是本专利技术实施例中一种基于对抗生成网络的小样本生成方法的主要步骤示意图;图2是本专利技术实施例中一种对抗生成网络的网络训练方法的主要步骤示意图。具体实施方式下面参照附图来描述本专利技术的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本专利技术的技术原理,并非旨在限制本专利技术的保护范围。参阅附图1,图1示例性示出了本实施例中基于对抗生成网络的小样本生成方法的主要步骤。如图1所示,本实施例中基于对抗生成网络的小样本生成方法可以包括如下步骤:步骤S101:获取符合预设数据分布的随机噪声以及预设的小样本类型对应的标签信息。具体地,本实施例中随机噪声可以是符合(-1,1)均匀分布的随机数。小样本类型可以是人脸表情的图像样本或特殊符号的图像样本。步骤S102:基于预先构建的对抗生成网络并根据随机噪声和标签信息,生成小样本类型对应的样本。具体地,本实本文档来自技高网...

【技术保护点】
1.一种基于对抗生成网络的小样本生成方法,其特征在于包括:获取符合预设数据分布的随机噪声以及预设的小样本类型对应的标签信息;基于预先构建的对抗生成网络并根据所述随机噪声和标签信息,生成所述小样本类型对应的样本;其中,所述对抗生成网络是基于卷积神经网络并利用机器学习算法所构建的网络,所述方法还包括按照下列步骤对所述对抗生成网络进行网络训练:利用所述机器学习算法并根据预设的源数据集对所述对抗生成网络进行网络训练,得到第一对抗生成网络;利用所述机器学习算法并根据预设的目标数据集对所述第一对抗生成网络进行网络训练,得到第二对抗生成网络;并且其中,所述源数据集中源数据的数量远大于所述目标数据集中目标数据的数量。

【技术特征摘要】
1.一种基于对抗生成网络的小样本生成方法,其特征在于包括:获取符合预设数据分布的随机噪声以及预设的小样本类型对应的标签信息;基于预先构建的对抗生成网络并根据所述随机噪声和标签信息,生成所述小样本类型对应的样本;其中,所述对抗生成网络是基于卷积神经网络并利用机器学习算法所构建的网络,所述方法还包括按照下列步骤对所述对抗生成网络进行网络训练:利用所述机器学习算法并根据预设的源数据集对所述对抗生成网络进行网络训练,得到第一对抗生成网络;利用所述机器学习算法并根据预设的目标数据集对所述第一对抗生成网络进行网络训练,得到第二对抗生成网络;并且其中,所述源数据集中源数据的数量远大于所述目标数据集中目标数据的数量。2.根据权利要求1所述的基于对抗生成网络的小样本生成方法,其特征在于,所述对抗生成网络包括生成网络和对抗网络;所述生成网络被配置为根据所述随机噪声和标签信息生成对抗样本;所述对抗网络被配置为根据所述对抗样本及其标签信息,获取所述对抗样本的真实概率;相应的,“基于预先构建的对抗生成网络并根据所述随机噪声和标签信息,生成所述小样本类型对应的样本”的步骤包括选取所述真实概率大于等于预设概率阈值的对抗样本作为所述小样本类型对应的样本。3.根据权利要求2所述的基于对抗生成网络的样本生成方法,其特征在于,“利用所述机器学习算法并根据预设的源数据集对所述对抗生成网络进行网络训练,得到第一对抗生成网络”的步骤包括:步骤S11:根据预设的第一训练批量获取所述源数据集中的源数据;步骤S12:利用所述机器学习算法并根据所述源数据对所述对抗生成网络中的生成网络进行网络迭代训练,并根据所述源数据和所述生成网络的生成数据,对所述对抗生成网络中的对抗网络进行网络训练;步骤S13:重复执行步骤S11~步骤S12并且当所述生成网络的生成数据满足预设的数据要求时停止训练。4.根据权利要求3所述基于对抗生成网络的样本生成方法,其特征在于,“利用所述机器学习算法并根据所述源数据对所述对抗生成网络中的生成网络进行网络迭代训练”的步骤包括:步骤S121:获取每个源数据对应的标签信息和随机噪声,并且对所述每个源数据对应的标签信息和随机噪声进行数据拼接得到第一拼接数据;步骤S122:利用所述机器学习算法并根据所述第一拼接数据对所述对抗生成网络中的生成网络进行网络训练;步骤S123:重复执行步骤S121~步骤S122并且当所述生成网络的生成数据满足预设的数据要求时停止训练。5.根据权利要求4所述基于对抗生成网络的样本生成方法,其特征在于,“根据所述源数据和所述生成网络的生成数据,对所述对抗生成网络中的对抗网络进行网络训练”的...

【专利技术属性】
技术研发人员:李扬曦杜翠兰井雅琪佟玲玲张翠胡卫明李文娟薛建明
申请(专利权)人:国家计算机网络与信息安全管理中心中国科学院自动化研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1