一种基于端到端的水场景音频的生成方法技术

技术编号：21458535 阅读：35 留言：0更新日期：2019-06-26 06:21

本发明专利技术属于音频处理的技术领域，具体涉及一种基于端到端的水场景音频的生成方法，包括如下步骤：步骤一，选取各类水场景视频，并进行预处理；步骤二，根据预处理后的数据，通过训练获得生成器模型；步骤三，将无声视频进行预处理，加载到训练好的生成器模型，输出与无声视频对应的音频；步骤四，根据音频的序列生成包络，并加载到训练好的音色增强器模型，输出音色增强后的音频。本发明专利技术能够实现端到端的户外水场景声音的自动生成，解决为场景配音费时和费力的问题，同时，利用训练所得的模型来生成水场景音频，能够提高生成速度和同步度，从而提高工作效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于端到端的水场景音频的生成方法
本专利技术属于音频处理的
，具体涉及一种基于端到端的水场景音频的生成方法。
技术介绍
随着计算机图形学技术的不断发展，人们对视频及动画的声音质量提出了更高的要求。而水场景，尤其是户外水场景存在于影视、游戏之中，所以开发一种能够自动的根据户外水场景视频去生成对应场景声音的方法显得十分必要。目前，人们大多利用基于物理的方法去生成水场景的声音。基于物理的水场景声音生成方法主要基于一种理论，即气泡的形成和共振是水声音的最主要的来源。Zheng等人在谐波气泡中提出一个基于谐波气泡的水流声音生成方法，通过对声音传播过程的考虑，其生成了包括水龙头流水在内的多种流水声音，但其所生成的结果需要经过繁琐的人为调整，随后，Langlois等人在基于复杂声学气泡的水模拟中提出一个基于二相不可压缩流体模拟的声音生成方法被提出，用于改进利用气泡生成的流体声音结果，其液体中的气泡不再采用随机的模型，而是根据流体的状态去产生更加真实的气泡，也使得最终的声音效果更加逼真，但这些方法的主要研究对象都局限于小规模的水流，并且，随着声音结果的不断改良，算法复杂度也在不断的提升，这就使得他们无法应用到户外水场景的声音合成中。深度学习的声音生成方法，基于视频去生成对应的声音。Owens等人在视觉表明声音中提出一个由卷积神经网络(CNN)和长短期记忆单元(LSTM)组合而成的神经网络，其通过输入每一帧视频灰度图及其前后帧灰度图像组成的spacetime图的图像特征，输出与视频相对应的声音耳蜗电图，再去声音库中寻找与此图最匹配的声音样本拼接生成最终结果，Che...

【技术保护点】
1.一种基于端到端的水场景音频的生成方法，其特征在于，包括如下步骤：步骤一，选取各类水场景视频，并进行预处理；步骤二，根据预处理后的数据，通过训练获得生成器模型；步骤三，将无声视频进行预处理，加载到训练好的所述生成器模型，输出与所述无声视频对应的音频；步骤四，根据所述音频的序列生成包络，并加载到训练好的音色增强器模型，输出音色增强后的所述音频。

【技术特征摘要】
1.一种基于端到端的水场景音频的生成方法，其特征在于，包括如下步骤：步骤一，选取各类水场景视频，并进行预处理；步骤二，根据预处理后的数据，通过训练获得生成器模型；步骤三，将无声视频进行预处理，加载到训练好的所述生成器模型，输出与所述无声视频对应的音频；步骤四，根据所述音频的序列生成包络，并加载到训练好的音色增强器模型，输出音色增强后的所述音频。2.如权利要求1所述的一种基于端到端的水场景音频的生成方法，其特征在于：步骤一中，所述预处理的方法，包括如下步骤：A1、提取视频帧的特征，获取视频的信息；A2、将每秒视频信息转换为与音频维度相同的向量。3.如权利要求2所述的一种基于端到端的水场景音频的生成方法，其特征在于：步骤二中，所述生成器模型的训练方法，包括如下步骤：B1、输入所述视频信息的向量，通过所述生成器模型输出音频信号；B2、评估所述音频信号，若不对应，则反馈给所述生成器模型，并重新进行调整，直到输出对应的音频信号；若对应，则继续进行下一个视频信息的训练。4.如权利要求1所述的一种基于端到端的水场景音频的生成方法，其特征在于：步骤四中，所述音色增强器模型的训练方法，包括如下步骤：C1、输入目标音频的包络，通过所述音色增强器模型输出所述音频的序列；C2、评估所述音频的序列，若不是目标序列，则反馈给所述音色增强器模型，并重新进行调整，直到输出目标音频的序列；若是目标序列，则继续进行下一个音色增强训练。5.如权利要求1所述的一种基于端到端的水场景音频的生成方法，其特征在于：步骤四中，所述包络的生成方法，包括如下步骤：D1、输入一段音频序列GV以及包络的采样间隔Lstep；D2、取音频序列GV中每一个采样间隔Lstep内的绝对值的最大值作为这段间隔内的一个包络点pi；D3、所有采样间隔内的包络点pi连接而成的数组Ep，经过线性插值形成长度...

【专利技术属性】
技术研发人员：刘世光，程皓楠，王凯，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人