一种改进的源分量及环境分量提取方法、设备及计算机可读存储介质技术

技术编号：30407172 阅读：34 留言：0更新日期：2021-10-20 11:15

本发明专利技术公开了一种改进的源分量及环境分量提取方法、设备及计算机可读存储介质，属于音视频处理技术领域。本发明专利技术的提取方法为：对两个声道的源分量能量之比进行估计，并求解音频在每帧的各正频率点分量值；然后获取环境分量相位角的最优估计；最后，通过共轭对称关系构建对应的负频率点分量值，并对每帧的各频率点分量值进行频域到时域的转换处理，得到待进行提取的双声道音频信号的左右升到的环境分量信号与源分量信号。本发明专利技术可用于立体声扩展，使得通道格式立体声音频可以与任意通道数的再现系统兼容。在音频质量方面，经本发明专利技术提取方法所提取出源分量、环境分量的时域波形与原始语音的左声道源分量、环境分量的波形具有高度一致性。高度一致性。高度一致性。

全部详细技术资料下载

【技术实现步骤摘要】
一种改进的源分量及环境分量提取方法、设备及计算机可读存储介质

[0001]本专利技术属于音频
，具体涉及一种改进的源分量及环境分量提取方法、设备及计算机可读存储介质。

技术介绍

[0002]如今基于通道的音频格式得到了广泛应用，但基于通道的音频往往具有特定的播放配置，即它无法与不同的播放系统兼容。因此考虑到当今播放系统的多样性，需要对不同通道数的音频信号进行分解和重构以满足不同配置的播放系统，并获得更好的空间质量(spatial quality)。
[0003]传统的音频重构技术根据播放系统分为两类，一种是扬声器播放，常见技术有混音(audio remixing)，另一种是耳机播放，常见技术有虚拟化(virtulization)等。基于文献《Spatial sound reproduction using conventional and parametric loudspeakers》和《Spatial audio processing:MPEG surround and other applications》可知，扬声器播放的音频重构需要额外的组件，导致相应的设备成本更加昂贵。另一方面耳机播放重构出的声音，其空间质量相对实录立体声还存在差距。
[0004]针对以上问题，一种改进的思路是通过前端算法处理的手段，建立立体声信号模型，使用音频的相位信息来营造更真实的空间听感。将双声道音频分解为源分量(primary component)和环境分量(ambient component)的线性组合，其...

【技术保护点】

【技术特征摘要】
1.基于双声道音频的一种改进的源分量及环境分量提取方法，其特征在于，包括：步骤1：估算左、右通道源分量之比k；其中，r
00
、r
11
分别表示左右通道源分量的自相关系数，r
01
表示左右通道源分量的互相关系数；步骤2：对进行分量提取的双声道音频信号进行分帧，将每帧信号变换到频域，并提取每一帧内左、右通道的正频率点的音频信号分量x
L
[m,f]、x
R
[m,f]，其中，m表示帧数，f表示频率值；且：x
L
[m,f]＝p
L
[m,f]+a
L
[m,f]，x
R
[m,f]＝p
R
[m,f]+a
R
[m,f]；其中，p
L
[m,f]、p
R
[m,f]分别表示左、右通道的正频点的源分量，a
L
[m,f]、a
R
[m,f]分别表示左、右通道的正频点的环境分量；步骤3：根据公式θ[m,f]＝∠(x
R
[m,f]
‑
kx
L
[m,f])构造参数θ[m,f]；步骤4：定义左、右通道环境分量的相位差为Δθ[f]＝∠a
R
[m,f]
‑
∠a
L
[m,f]，其中，∠a
R
[m,f]、∠a
L
[m,f]分别表示环境分量a
R
[m,f]、a
L
[m,f]所对应的正频点的相位；将相位差Δθ[f]的取值范围(
‑
π,π]等距离划分为多个值，得到多个离散的角度θ
i
，下标i表示角度编号；遍历每个角度θ
i
，计算当相位差Δθ[f]的取值为θ
i
时的不同帧的同一频点的右声道源分量的1范数之和；取不同帧同一频点的右声道源分量的1范数之和最小时的角度θ
i
作为相位差Δθ[f]的最优估计值；步骤5：计算相位∠a
R
[m,f]和∠a
L
[m,f]，其中∠a
R
[m,f]有两组计算结果，分别定义为∠a
R
...

【专利技术属性】
技术研发人员：史创，王苹洁，杨浩聪，刘英子，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人