一种音乐混响强度估计方法、装置及电子设备制造方法及图纸

技术编号：33707198 阅读：12 留言：0更新日期：2022-06-06 08:32

本发明专利技术公开了一种音乐混响强度估计方法，该方法包括：通过获取原始音乐中带有混响的原始人声信号；对原始人声信号分别进行编码和声纹处理，得到编码向量和声纹向量；将编码向量和声纹向量进行拼接，并将拼接后的向量输入分离网络得到掩码向量；将掩码向量和编码向量叠加后进行解码得到去除混响后的人声信号；基于去除混响后的人声信号和带有混响的原始人声信号估计原始音乐的混响强度。本发明专利技术通过对原始人声信号进行处理，然后根据处理结果进行预测，不会存在相位缺失的情况，有效提高了预测结果的准确度；同时加入了声纹处理，利用了不同人嗓音不同的特点，使音乐混响强度的估计更加准确。加准确。加准确。

全部详细技术资料下载

【技术实现步骤摘要】
一种音乐混响强度估计方法、装置及电子设备

[0001]本专利技术涉及音频处理
，具体涉及一种音乐混响强度估计方法、装置及电子设备。

技术介绍

[0002]在狭小的空间内，播放音乐的效果会受到限制，尤其是混响较小的音乐，音乐效果不够自然。如果可以给歌曲加入混响，会为用户打造更好的听歌体验。为了区别需要加入混响的音乐种类，以及需要加入混响的强度，需要先准确估计出音乐自身的混响大小。
[0003]现有技术中通常采用滤波后的混合信号提供对混响感知水平的度量，但是这种方案除了需要输入原始信号分量，还需要把原始信号分量进行混响器处理，然后将原始信号分量和处理后的信号分量共同输入用于感知强度的度量装置，进而估计出需要多大的混响强度加入到原始信号分量上。所以这个技术的输出极大的依赖于混响器的混响强度。而现在的商业音乐是经过录音房录制并经过混响处理的，由于我们不知道是采用何种方式进行的混响，对音乐中的混响强度的估计值准确度较低。

技术实现思路

[0004]有鉴于此，本专利技术实施例提供了一种音乐混响强度估计方法，以解决对音乐中的混响强度的估计值准确度较低的问题。
[0005]为达到上述目的，本专利技术提供如下技术方案：
[0006]本专利技术实施例提供了一种音乐混响强度估计方法，包括：
[0007]获取原始音乐中带有混响的原始人声信号；
[0008]对所述原始人声信号分别进行编码和声纹处理，得到编码向量和声纹向量；
[0009]将所述编码向量和所述声纹向量进行拼接，...

【技术保护点】

【技术特征摘要】
1.一种音乐混响强度估计方法，其特征在于，包括：获取原始音乐中带有混响的原始人声信号；对所述原始人声信号分别进行编码和声纹处理，得到编码向量和声纹向量；将所述编码向量和所述声纹向量进行拼接，并将拼接后的向量输入分离网络得到掩码向量；将所述掩码向量和所述编码向量叠加后进行解码得到去除混响后的人声信号；基于所述去除混响后的人声信号和带有混响的原始人声信号估计所述原始音乐的混响强度。2.根据权利要求1所述的音乐混响强度估计方法，其特征在于，所述对所述原始人声信号分别进行编码和声纹处理，得到编码向量和声纹向量，包括：将所述原始人声信号按照预设的步长进行划分；将划分后的原始人声信号进行编码得到编码向量；通过预设算法从所述原始人声信号中提取频谱特征向量；将所述频谱特征向量进行声纹处理得到声纹向量。3.根据权利要求2所述的音乐混响强度估计方法，其特征在于，所述通过预设算法从所述原始人声信号中提取频谱特征向量，包括：将所述原始人声信号进行傅里叶分析，得到第一频谱；对所述第一频谱进行滤波得到第二频谱；基于所述第一频谱和所述第二频谱计算得到所述频谱特征向量。4.根据权利要求2所述的音乐混响强度估计方法，其特征在于，所述将所述频谱特征向量进行声纹处理得到声纹向量，包括：将所述频谱特征向量通过帧表示层得到隐层向量；将所述隐层向量输入统计池化层提取特征表达向量；将所述特征表达向量输入全连接层进行降维得到声纹向量。5.根据权利要求1所述的音乐混响强度估计方法，其特征在于，所述将拼接后的向量输入分离网络得到掩码向量，包括：通过多头注意力机制对所述拼接后的向量进行识别得到多个局部特征向量；通过多头注意力机制对所述局部特征向量进行识别得到掩码向量。6...

【专利技术属性】
技术研发人员：于洋，
申请(专利权)人：镁佳北京科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人