一种音频风格转换方法和系统技术方案

技术编号：27446745 阅读：18 留言：0更新日期：2021-02-25 04:14

本发明专利技术公开了一种音频风格转换方法，包括如下内容：获取待转换风格的音频的内容；获取目标音频的风格；对内容和风格波形分别进行预处理，以分别获取内容信号和风格信号；通过声音纹理模型分别提取内容信号和风格信号的纹理统计信息；通过优化算法将内容纹理统计信息和风格纹理统计信息合成，以获取合成音频并输出。本发明专利技术还公开了一种音频风格转换系统。本发明专利技术能够使得合成音频的音质自然、生动。生动。生动。

全部详细技术资料下载

【技术实现步骤摘要】
一种音频风格转换方法和系统

[0001]本专利技术涉及音频信号处理
，具体涉及一种音频风格转换方法和系统。

技术介绍

[0002]目前，视觉
中，在卷积神经网络(CNN)的推动下，图像之间的风格转换成为一个非常活跃的研究主题，并迅速成为社交媒体中一种非常流行的技术。而音频
中，例如，专业音频编辑，音乐创作，声音设计和电影后期制作(包括配音)，将音频的风格转换已成为迫切的需求。

技术实现思路

[0003]本专利技术的目的在于提供一种音频风格转换方法和系统，以解决上述技术问题。
[0004]为达此目的，本专利技术采用以下技术方案：
[0005]提供一种音频风格转换方法，其改进之处在于，包括如下内容：
[0006]获取待转换风格的音频的内容；
[0007]获取目标音频的风格；
[0008]对内容和风格波形分别进行预处理，以分别获取内容信号和风格信号；
[0009]通过声音纹理模型分别提取内容信号和风格信号的纹理统计信息；
[0010]通过优化算法将内容纹理统计信息和风格纹理统计信息合成，以获取合成音频并输出。
[0011]本专利技术还提供了一种音频风格转换系统，其改进之处，包括：
[0012]内容获取模块，用于获取待转换风格的音频的内容；
[0013]风格获取模块，用于获取目标音频的风格；
[0014]处理模块，用于对内容和风格波形分别进行预处理，以分别获取内容信号和风格信号；
[0015]提取...

【技术保护点】

【技术特征摘要】
1.一种音频风格转换方法，其特征在于，包括如下内容：获取待转换风格的音频的内容；获取目标音频的风格；对内容和风格波形分别进行预处理，以分别获取内容信号和风格信号；通过声音纹理模型分别提取内容信号和风格信号的纹理统计信息；通过优化算法将内容纹理统计信息和风格纹理统计信息合成，以获取合成音频并输出。2.根据权利要求1所述一种音频风格转换方法，其特征在于，所述对内容和风格波形分别进行预处理，以分别获取内容信号和风格信号，其中，对内容和风格波形分别通过短时傅里叶变换处理，以分别获取内容信号和风格信号的2D频谱图信号。3.根据权利要求1所述一种音频风格转换方法，其特征在于，所述通过声音纹理模型分别提取内容信号和风格信号的纹理统计信息，其中，声音纹理模型为神经网络或工程感知模型。4.根据权利要求1所述一种音频风格转换方法，其特征在于，所述声音纹理模型包括：通过带通耳蜗滤波器将波形分解为声频带；提取每个频带的包络，并对其施加...

【专利技术属性】
技术研发人员：ꢀ五一IntClG一零L二一零零七，
申请(专利权)人：北京中科深智科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人