一种基于生成对抗网络的海豚叫声生成方法技术

技术编号:39069513 阅读:25 留言:0更新日期:2023-10-12 20:01
本申请提供了一种基于生成对抗网络的海豚叫声生成方法,其解决了现有海豚叫声数据获取困难的技术问题;包括以下步骤:海豚叫声预处理;构建生成对抗网络,定义损失函数;训练判别器模型、生成器模型;生成海豚叫声;其中,生成对抗网络包括生成器模型、判别器模型;其中,生成对抗网络包括生成器模型、判别器模型。生成器模型损失函数、判别器模型损失函数为本申请设计的。该方法可以有效的生成大量海豚叫声,为海豚声音采集与分析提供了大量数据资源。本申请应用于海豚声音采集与分析的技术领域。域。域。

【技术实现步骤摘要】
一种基于生成对抗网络的海豚叫声生成方法


[0001]本申请涉及一种海豚叫声生成方法,更具体地说,是涉及一种基于生成对抗网络的海豚叫声生成方法。

技术介绍

[0002]目前,数据缺乏仍然是阻碍深度学习技术发展的重要原因之一,且完备的数据集应具有大规模性、多样性,多样性不仅仅指从不同角度分类的实测数据,还应包含有以现有的技术手段获得的高质量的仿真数据(梁俊杰,韦舰晶,蒋正锋.生成对抗网络GAN综述[J].计算机科学与探索,2020,14(01):1

17)。近年来利用深度生成模型生成虚假数据成为研究的热点,尤其是生成对抗网络(generative adversarial networks,GAN)(Goodfellow I,Pouget

Abadie J,Mirza M,et al. Generative Adversarial Nets[C]Neural Information Processing Systems.MIT Press,2014)提出以来,AI一键换脸、AI图像修复等各种应用层出不穷,随后发展的GAN衍生模型也被应用于各个领域。GAN能够从大量无标签数据中无监督地学习到各种数据特征,在数据扩充领域有较强的通用性(黄琼男,朱卫纲,李永刚.基于GAN的SAR数据扩充研究综述[J].兵器装备工程学报,2021,42(11):31

38)。
[0003]由于海豚叫声的采集非常困难,能采集到的数据有限,且会消耗大量人力、物力。因此,需要能根据少数海豚叫声数据生成大量海豚叫声数据的方法。

技术实现思路

[0004]为解决现有海豚叫声数据获取困难的问题,本申请采用的技术方案是:提供一种基于生成对抗网络的海豚叫声生成方法,包括以下步骤:海豚叫声预处理;构建生成对抗网络,定义损失函数;训练判别器模型、生成器模型;生成海豚叫声;其中,生成对抗网络包括生成器模型、判别器模型;判别器模型损失函数表示如下:
[0005]生成器模型损失函数表示如下:
[0006]其中, D(x)表示判别器模型对真实海豚叫声的判别结果,z表示随机噪声向量,G(z)表示生成器模型生成海豚叫声,Pr(x)表示真实海豚叫声x数据集,表示在真
实海豚叫声分布中的海豚叫声期望,Pn(z)表示随机噪声向量z数据集,表示在随机噪声向量分布中的随机噪声向量,D(G(z))表示判别器模型对生成器模型生成海豚叫声的判别结果,表示判别器模型的输出结果。
[0007]优选地,海豚叫声预处理,具体通过以下方式实现:获取海豚叫声,先标准化处理后短时傅里叶变换,生成频域海豚叫声样本。
[0008]优选地,生成器模型依次设置有全连接层、重构层、激活层和四个卷积单元。
[0009]优选地,判别器模型依次设置有三个卷积单元和重构层、全连接层、激活层。
[0010]优选地,卷积单元依次由卷积层和激活层连接组成。
[0011]优选地,生成器模型中,前四层激活层的激活函数为ReLU函数,最后一层激活层的激活函数为Tanh函数。
[0012]优选地,判别器模型中,前三层激活层的激活函数为LeakyReLU函数,最后一层激活层的激活函数为sigmoid函数。
[0013]优选地,训练判别器模型、生成器模型,具体通过以下方式实现:将海豚叫声样本和随机噪声向量分别送入判别器模型和生成器模型进行对抗学习,采用梯度下降算法来优化生成器模型损失函数和判别器模型损失函数,更新生成器模型和判别器模型的参数,多次迭代完成训练。
[0014]优选地,生成海豚叫声,具体通过以下方式实现:随机生成N个的噪声向量,输入到训练好的生成器模型,输出N个生成海豚叫声的频域数据,再进行短时傅里叶逆变换生成海豚叫声。
[0015]本专利技术的有益效果,首先对海豚叫声进行预处理,后将海豚叫声样本和随机噪声向量分别送入判别器模型和生成器模型,对判别器模型和生成器模型进行对抗学习,采用梯度下降算法来优化本申请设计的生成器模型损失函数和判别器模型损失函数,更新生成器模型和判别器模型参数,在多次迭代之后,生成器模型和判别器模型完成训练。利用训练好的海豚叫声生成器模型,生成海豚叫声。该方法可以有效的生成大量海豚叫声,为海豚声音采集与分析提供了大量数据资源。
附图说明
[0016]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0017]图1为本申请一实施例提供的一种基于生成对抗网络的海豚叫声生成方法的流程示意图;图2为本申请一实施例提供的海豚叫声预处理流程图;图3为本申请一实施例提供的生成器模型结构示意图;图4为本申请一实施例提供的判别器模型结构示意图。
具体实施方式
[0018]为了使本申请所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0019]由于声音的采集非常困难,能采集到的数据有限,且会消耗大量人力、物力,因此专利技术了一种生成对抗模型根据已有的少数海豚叫声数据生成大量海豚叫声数据。
[0020]请参阅图1,为本申请一实施例提供的一种基于生成对抗网络的海豚叫声生成方法的流程示意图,为了便于说明,仅示出了与本实施例相关的部分,详述如下:在其中一实施例中,一种基于生成对抗网络的海豚叫声生成方法,其包括:S101、海豚叫声预处理:获取海豚叫声数据,处理生成频域海豚叫声样本;具体地,如图2所示,海豚叫声预处理采用以下步骤实现:采集海豚叫声15秒,等分为30份,再扩大到412个0.5s样本,后对412个样本做标准化处理,使其分布在[

1,1]之间:
[0021]其中,x(m)表示海豚叫声数据,max|x(m)|表示海豚叫声数据的最大值。
[0022]再做短时傅里叶变换(STFT),使其变换到频域:
[0023]其中,w(m)表示窗函数,w(n

m)表示窗函数w(m)反褶后右移n个单位。其中,STFT窗函数选择海宁窗,交叠长度为128,窗长256,最终每个样本大小为128*129。
[0024]S102、构建生成对抗网络,定义损失函数;生成对抗网络包括生成器模型、判别器模型;具体地,生成器模型、判别器模型构建结构如下:请参阅图3,生成器模型依次设置有全连接层,重构层,激活层,四个卷积单元。进一步地,卷积单元依次由卷积层和激活层连接组成。
[0025]在其中一实施例中,生成器模型具体网络结构设置:全连接层输入1*1*100,变换为输出为256*64*1;重构层输出为4*4*1024,卷积层的步长依次为2、4、2、2,所有卷积层卷积核大小为5*5本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于生成对抗网络的海豚叫声生成方法,其特征在于:包括以下步骤:海豚叫声预处理;构建生成对抗网络,定义损失函数;训练判别器模型、生成器模型;生成海豚叫声;其中,所述生成对抗网络包括生成器模型、判别器模型;判别器模型损失函数表示如下:生成器模型损失函数表示如下:其中, D(x)表示判别器模型对真实海豚叫声的判别结果,z表示随机噪声向量,G(z)表示生成器模型生成海豚叫声,Pr(x)表示真实海豚叫声x数据集,表示在真实海豚叫声分布中的海豚叫声期望,Pn(z)表示随机噪声向量z数据集,表示在随机噪声向量分布中的随机噪声向量,D(G(z))表示判别器模型对生成器模型生成海豚叫声的判别结果,表示判别器模型的输出结果。2.如权利要求1所述的基于生成对抗网络的海豚叫声生成方法,其特征在于:所述海豚叫声预处理,具体通过以下方式实现:获取海豚叫声,先标准化处理后短时傅里叶变换,生成频域海豚叫声样本。3.如权利要求2所述的基于生成对抗网络的海豚叫声生成方法,其特征在于:所述生成器模型依次设置有全连接层、重构层、激活层和四个卷积单元。4.如权利要求3所述的基于生成对抗网络的海豚叫声生成方法,其特征在于:所述判别器模型依次设置有三个卷积单元和重构层、全连接层、激活层。5.如权利要...

【专利技术属性】
技术研发人员:娄毅毕守华周志权
申请(专利权)人:哈尔滨工业大学威海
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1