用于控制多声道音频帧丢失隐藏的方法和装置制造方法及图纸

技术编号：29503456 阅读：42 留言：0更新日期：2021-07-30 19:18

提供了一种在解码设备中对多声道音频信号的丢失或损坏多声道音频帧进行近似的方法。该设备可生成下混合错误隐藏帧，并将该帧变换到频域中以生成变换后下混合错误隐藏帧。该设备可对变换后的帧去相关以生成去相关隐藏帧。该设备可获得先前接收的多声道音频信号帧的已存储残差信号的残差信号频谱，并使用残差信号频谱生成能量被调整的去相关残差信号隐藏帧。该设备可获得多声道音频替换参数集，并将这些帧和替换参数提供给音频合成组件以生成合成多声道音频帧。该设备执行音频帧的逆频域变换以生成丢失或损坏音频帧的替换帧。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于控制多声道音频帧丢失隐藏的方法和装置
本申请涉及用于针对立体声或多声道音频编码和解码来控制分组丢失隐藏的方法和装置。
技术介绍
尽管电信网络的容量在不断增加，但限制每个通信信道的需要带宽仍然有极大兴趣。在移动网络中，用于每次呼叫的传输带宽越小，移动设备和基站的功耗就越低。这对于移动运营商转化成对能源和成本的节约，而最终用户将体验更长的电池寿命和更长的通话时间。进一步地，由于每个用户消耗的带宽更少，移动网络可并行为更大数量的用户提供服务。通过现代音乐播放系统和电影院，大多数听众习惯于高质量沉浸式音频。在移动电信服务中，对无线电资源的约束和处理延迟已使质量保持在较低水平，并且大多数语音服务仍然仅传递单声道声音。最近，在需要单声道之外的沉浸式声音再现的虚拟/混合/增强现实的环境中，用于通信服务的立体声和多声道声音获得了动力。在电信网络的带宽约束内渲染高质量空间声音仍然是挑战。另外，声音再现还需要应对变化的信道条件，其中偶尔的数据分组可能例如由于网络拥塞或小区覆盖范围差而丢失。在典型的立体声录音中，声道对表现出高...

【技术保护点】
1.一种在包括处理器的解码设备中对所接收的多声道音频信号的丢失或损坏多声道音频帧进行近似的方法，所述方法包括由所述处理器执行的以下操作：/n生成下混合错误隐藏帧(610，720，820，1201)；/n将所述下混合错误隐藏帧变换到频域中以生成变换后下混合错误隐藏帧(1203)；/n对所述变换后下混合隐藏帧去相关以生成去相关隐藏帧(620，730，830，1205)；/n获得先前接收的多声道音频信号帧的已存储残差信号的残差信号频谱(1207)；/n使用所述残差信号频谱生成能量被调整的去相关残差信号隐藏帧(640-660，745-755，850-860，1209)；/n获得多声道音频替换参数集；/...

【技术特征摘要】
【国外来华专利技术】20181220 US 62/7824531.一种在包括处理器的解码设备中对所接收的多声道音频信号的丢失或损坏多声道音频帧进行近似的方法，所述方法包括由所述处理器执行的以下操作：
生成下混合错误隐藏帧(610，720，820，1201)；
将所述下混合错误隐藏帧变换到频域中以生成变换后下混合错误隐藏帧(1203)；
对所述变换后下混合隐藏帧去相关以生成去相关隐藏帧(620，730，830，1205)；
获得先前接收的多声道音频信号帧的已存储残差信号的残差信号频谱(1207)；
使用所述残差信号频谱生成能量被调整的去相关残差信号隐藏帧(640-660，745-755，850-860，1209)；
获得多声道音频替换参数集；
向参数多声道音频合成组件提供(1213)所述变换后下混合错误隐藏帧、所述能量被调整的去相关残差隐藏帧、以及多声道音频替换参数，以生成合成多声道音频帧；以及
执行(1215)所述合成多声道音频帧的逆频域变换以生成所述丢失或损坏多声道音频帧的替换帧。

2.根据权利要求1所述的方法，其中，通过重复来自所述先前接收的多声道音频信号帧的参数来获得所述多声道音频替换参数集。

3.根据权利要求1-2中任一项所述的方法，还包括：
基于所述替换帧来生成(1601)多声道音频信号；以及
向至少一个扬声器输出(1603)所述多声道音频信号以用于回放。

4.根据权利要求1-3中任一项所述的方法，其中，获得所述残差信号频谱包括：从存储设备取回所述残差信号频谱。

5.根据权利要求1-4中任一项所述的方法，其中，生成所述能量被调整的去相关残差信号隐藏帧包括：
对所述残差信号频谱的峰值正弦分量进行相移(650，750，840，1301)；以及
调整(640，745，850，1303)所述已存储残差信号的所述残差信号频谱的非峰值正弦分量的噪声频谱的能量。

6.根据权利要求1-4中任一项所述的方法，其中，生成所述能量被调整的去相关残差信号隐藏帧包括：
在分数频率的尺度上检测所述已存储残差信号的所述残差信号频谱的峰值频率(1401，1701)；
将每个峰值频率与表示该峰值频率的多个峰值频率区相关联(1403，1703)；
根据相位调整来对所述多个峰值频率区中的每一个应用相位调整(650，750，840，1405，1705)以形成残差信号隐藏频谱；以及
使用所述去相关隐藏帧的谱系数来填充所述残差信号隐藏频谱的剩余区(1407，1707)，并且调整所述剩余区的能级以匹配所述残差信号频谱的噪声频谱的能级。

7.根据权利要求1-4中任一项所述的方法，其中，生成所述能量被调整的去相关残差信号隐藏帧包括：
在分数频率的尺度上检测在所述已存储残差信号的所述残差信号频谱中是否存在峰值频率(650，750，840，1701)；
响应于检测到在所述残差信号频谱中没有峰值频率：
使用所述去相关隐藏帧的谱系数来填充(1709)所述残差信号隐藏频谱的每个区，并调整所述区的能级以匹配所述残差信号频谱的噪声频谱的能级；
响应于检测到在所述残差信号频谱中存在峰值频率：
将每个峰值频率与表示该峰值频率的多个峰值频率区相关联(1703)；
根据相位调整来对所述多个峰值频率区中的每一个应用相位调整(650，750，840，1705)以形成残差信号隐藏频谱；以及
使用所述去相关隐藏帧的谱系数来填充所述残差信号隐藏频谱的剩余区(1707)，并调整所述剩余区的能级以匹配所述残差信号频谱的噪声频谱的能级。

8.根据权利要求6-7中任一项所述的方法，其中，调整所述剩余区的能级以匹配所述残差信号频谱的噪声频谱的能级包括：以频带为基础来匹配所述能级。

9.根据权利要求6-8中任一项所述的方法，其中，调整所述能级包括：将所述去相关隐藏帧的区的相位与所述残差信号隐藏频谱的区的幅度进行组合。

10.根据权利要求9所述的方法，其中，组合所述相位包括：通过将所述残差信号隐藏频谱的实分量和虚分量的符号和阶数匹配到所述去相关隐藏帧来应用近似相位调整。

11.根据权利要求7所述的方法，其中，匹配所述能级包括：
计算能量匹配增益因子gk为

以及
用能量被调整的去相关残差隐藏帧来填充所述剩余区，

12.根据权利要求7所述的方法，其中，频带b跨越(1501)区范围kstart(b)…kend(b)，并且匹配所述能级包括：
计算(1503)能量匹配增益因子gb为

以及
用能量被调整的去相关残差隐藏帧来填充(1505)所述剩余区，
对于频带b，

13.根据权利要求1-12中任一项所述的方法，其中，生成所述能量被调整的去相关残差信号隐藏帧与将所述下混合错误隐藏帧变换到频域中和对所述变换后下混合隐藏帧去相关并行地执行。

14.根据权利要求1-13中任一项所述的方法，其中，将所述下混合错误隐藏帧变换到频域中和对所述变换后下混合隐藏帧去相关中的一个在将所述下混合错误隐藏帧变换到频域中和对所述变换后下混合隐藏帧去相关中的另一个之前被执行。

15.一种用于通信网络的解码器(100)，所述解码器(100)包括：
处理器(1101)；以及
与所述处理器耦合的存储器(1103)，其中，所述存储器包括指令，所述指令在由所述处理器执行时使得所述处理器执行根据权利要求1-14中任一项所述的操作。

16.一种计算机程序，包括计算机可执行指令，所述计算机可执行指令被配置为当所述计算机可执行指令在设备所包括的处理器(1101)上被执行时使得所述设备执行根据权利要求1-14中任一项所述的方法。

17.一种计算机程序产品，包括计算机可读存储介质(1103)，所述计算机可读存储介质具有计算机可执行指令，所述计算机可执行指令被配置为当所述计算机可执行指令在设备所包括的处理器(1101)上被执行时使得所述设备执行根据权利要求1-14中任一项所述的方法。

18.一种被配置为对所接收的多声道音频信号的丢失或损坏多声道音频帧进行近似的装置，所述装置包括：
至少一个处理器(1101)；
与所述处理器通信耦合的存储器(1103)，所述存储器包括可由处理器执行的指令，所述指令使得处理器执行操作，所述操作包括：
生成下混合错误隐藏帧(610，720，820，1201)；
将所述下混合错误隐藏帧变换到频域中以生成变换后下混合错误隐藏帧(1203)；
对所述变换后下混合隐藏帧去相关以生成去相关隐藏帧(620，730，830，1205)；
获得先前接收的多声道音频信号帧的已存储残差信号的残差信号频谱(1207)；
使用所述残差信号频谱生成能量被调整的去相关残差信号隐藏帧(640-660，745-755，850-860，1209)；
获得(1211)多声道音频替换参数集；
向参数多声道音频合成组件提供(1213)所述变换后下混合错误隐藏帧、所述能量被调整的去相关残差隐藏帧、以及来自所述先前接收的多声道音频信号帧的多声道音频参数，以生成合成多声道音频帧；以及
执行(1215)所述合成多声道音频帧的逆频域变换以生成所述丢失或损坏多声道音频帧的替换帧。

19.根据权利要求18所述的装置，其中，通过重复来自所述先前接收的多声道音频信号帧的参数来获得所述多声道音频替换参数集。

20.根据权利要求18-19中任一项所述的装置，还包括：
基于所述替换帧来生成(1601)多声道音频信号；以及
向至少一个扬声器输出(1603)所述多声道音频信号以用于回放。

21.根据权利要求18-20中任一项所述的装置，其中，获得所述残差信号频谱包括：从存储设备取回所述残差信号频谱。

22.根据权利要求18-21中任一项所述的装置，其中，生成所述能量被调整的去相关残差信号隐藏帧包括：
对所述残差信号频谱的峰值正弦分量进行相移(650，750，840，1301)；以及
调整(640，745，850，1303)所述已存储残差信号的所述残差信号频谱的非峰值正弦分量的噪声频谱的能量。

23.根据权利要求18-21中任一项所述的装置，其中，生成所述能量被调整的去相关残差信号隐藏帧包括：
在分数频率的尺度上检测所述已存储残差信号的所述残差信号频谱的峰值频率(1401，1701)；
将每个峰值频率与表示该峰值频率的多个峰值频率区相关联(1403，1703)；
根据相位调整来对所述多个峰值频率区中的每一个应用相位调整(650，750，840，1405，1705)以形成残差信号隐藏频谱；以及
使用所述去相关隐藏帧的谱系数来填充所述残差信号隐藏频谱的剩余区(1407，1707)，并调整所述剩余区的能级以匹配所述残差信号频谱的噪声频谱的能级。

24.根据权利要求18-21中任一项所述的装置，其中，生成所述能量被调整的去相关残差信号隐藏帧包括：
在分数频率的尺度上检测在所述已存储残差信号的所述残差信号频谱中是否存在峰值频率(650，750，840，1701)；
响应于检测到在所述残差信号频谱中没有峰值频率：
使用所述去相关隐藏帧的谱系数来填充(1709)所述残差信号隐藏频谱的每个区，并调整所述区的能级以匹配所述残差信号频谱的噪声频谱的能级；
响应于检测到在所述残差信号频谱中存在峰值频率：
将每个峰值频率与表示该峰值频率的多个峰值频率区相关联(1703)；
根据相位调整来对所述多个峰值频率区中的每一个应用相位调整(650，750，840，1705)以形成残差信号隐藏频谱；以及
使用所述去相关隐藏帧的谱系数来填充所述残差信号隐藏频谱的剩余区(1707)，并调整所述剩余区的能级以匹配所述残差信号频谱的噪声频谱的能级。

25.根据权利要求23-24中任一项所述的装置，其中，调整所述剩余区的能级以匹配所述残差信号频谱的噪声频谱的能级包括：以频带为基础来匹配所述能级。

26.根据权利要求23-24中任一项所述的装置，其中，调整所述能级包括：将所述去相关隐藏帧的区的相位与所述残差信号隐藏频谱的区的幅度进行组合。

27.根据权利要求26所述的装置，其中，组合所述相位包括：通过将所述残差信号隐藏频谱的实分量和虚分量的符号和阶数匹配到所述去相关隐藏帧来应用近似相位调整。

28.根据权利要求25所述的装置，其中，匹配所述能级包括：
计算能量匹配增益因子gk为

以及
用能量被调整的去相关残差隐藏帧来填充所述剩余区，

29.根据权利要求25所述的装置，其中，频带b跨越(1501)区范围kstart(b)…kend(b)，并且匹配所述能级包括：
计算(1503)能量匹配增益因子gb为

以及
用能量被调整的去相关残差隐藏帧来填充(1505)所述剩余区，
对于频带b，

30.一种音频解码器，包括根据权利要求18-29中任一项所述的装置。

31.一种被配置为执行操作的解码器，所述操作包括：
生成下混合错误隐藏帧(610，720，820，1201)；
将所述下混合错误隐藏帧变换到频域中以生成变换后下混合错误隐藏帧(1203)；
对所述变换后下混合隐藏帧去相关以生成去相关隐藏帧(620，730，830，1205)；
获得先前接收的多声道音频信号帧的已存储残差信号的残差信号频谱(1207)；
使用所述残差信号频谱生成能量被调整的去相关残差信号隐藏帧(640-660，745-755，850-860，1209)；
获得(1211)多声道音频替换参数集；
向参数多声道音频合成组件提供(1213)所述变换后下混合错误隐藏帧、所述能量被调整的去相关残差隐藏帧、以及来自所述先前接收的多声道音频信号帧的多声道音频参数，以生成合成多声道音频帧；以及
执行(1215)所述合成多声道音频帧的逆频域变换以生成所述丢失或损坏多声道音频帧的替换帧。

32.根据权...

【专利技术属性】
技术研发人员：E·诺维尔，C·莫拉迪阿舒尔，
申请(专利权)人：瑞典爱立信有限公司，
类型：发明
国别省市：瑞典;SE

全部详细技术资料下载我是这个专利的主人