【技术实现步骤摘要】
音频处理方法及装置
本申请涉及音频信号处理领域,尤其涉及一种音频处理方法及装置。
技术介绍
随着人工智能技术的发展,语音方面的智能应用也越来越多。在影视配音行业,可将原演员的音色特征加入到本地化电影配音中,让配音更原汁原味。在卡拉OK等数字化娱乐行业,可以在保留音色的同时修改音高信息,实现修音。在医疗领域里,声音转换技术可以提升声道受损的病人的声音的可懂性。在军事国防领域里,语音转换技术可以在通信中对说话人语音进行伪装。在日常生活中,手机语音助手、问答机器人、电子读书和虚拟歌姬等都和音色音高相关。现有技术中,大多都是通过语音信号模型,来分离语音信号中的声源信息和声道信息,以提取特征参数的。其中,通过将这些特征参数进行转换,可合成新的音频合成信号。然而,根据现有技术所合成的音频合成信号的信号质量不高。
技术实现思路
本申请实施例提供一种音频处理方法及装置,可提高音频合成信号的信号质量,适用性高。第一方面,本申请实施例提供了一种音频处理方法,该方法包括:获取原始音频信号,并从所述原始音频信号中 ...
【技术保护点】
1.一种音频处理方法,其特征在于,所述方法包括:/n获取原始音频信号,并从所述原始音频信号中获取基频序列、频谱包络序列,以及非周期参数序列;/n获取基频调整参数,根据所述基频调整参数对所述基频序列进行调整以生成目标基频序列;/n根据所述目标基频序列、所述频谱包络序列以及所述非周期参数序列确定线性频谱;/n将所述线性频谱转换为非线性频谱,并根据所述非线性频谱生成目标音频信号。/n
【技术特征摘要】
1.一种音频处理方法,其特征在于,所述方法包括:
获取原始音频信号,并从所述原始音频信号中获取基频序列、频谱包络序列,以及非周期参数序列;
获取基频调整参数,根据所述基频调整参数对所述基频序列进行调整以生成目标基频序列;
根据所述目标基频序列、所述频谱包络序列以及所述非周期参数序列确定线性频谱;
将所述线性频谱转换为非线性频谱,并根据所述非线性频谱生成目标音频信号。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标基频序列、所述频谱包络序列以及所述非周期参数序列确定线性频谱,包括:
基于所述目标基频序列、所述频谱包络序列以及所述非周期参数序列生成粗合成音频信号;
对所述粗合成音频信号进行分帧加窗处理,以得到组成所述粗合成音频信号的至少一个第一分帧信号;
对所述至少一个第一分帧信号中每个第一分帧信号进行短时傅里叶变换以得到每个第一分帧信号对应的子线性频谱;
将各子线性频谱进行拼接,以得到所述粗合成音频信号对应的线性频谱。
3.根据权利要求1或2所述的方法,其特征在于,所述从所述原始音频信号中获取基频序列,包括:
对所述原始音频信号进行分帧加窗处理,以得到组成所述原始音频信号的至少一个第二分帧信号;
针对第二分帧信号,采用多个截止频率的低通滤波器分别对所述第二分帧信号进行滤波,以得到所述第二分帧信号分别经所述多个截止频率的低通滤波器后得到的多个滤波信号;
根据每个滤波信号的周期信息确定每个滤波信号的截止频率的置信度;
从多个置信度中确定出最大置信度对应的截止频率作为所述第二分帧信号对应的基频;
将各第二分帧信号对应的基频进行拼接以得到基频序列。
4.根据权利要求3所述的方法,其特征在于,所述从所述原始音频信号中获取频谱包络序列,包括:
对所述至少一个第二分帧信号中每个第二分帧信号进行短时傅里叶变换以得到每个第二分帧信号对应的子线性频谱;
对每个第二分帧信号对应的子线性频谱求绝对值以得到每个第二分帧信号的功率谱;
对每个第二分帧信号对应的功率谱求对数并作相位展开,再进行逆傅里叶变换以得到每个第二分帧信号对应的功率谱的倒谱;
基于低通滤波器对每个第二分帧信号对应的功率谱的倒谱进行滤波,以得到每个第二分帧信号对应的频谱包络;
将各...
【专利技术属性】
技术研发人员:庄晓滨,
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。