音频帧丢失隐藏制造技术

技术编号:19010340 阅读:21 留言:0更新日期:2018-09-22 10:04
通过对先前接收的或重构的音频信号的部分指定正弦分析(81)来隐藏接收的音频信号的丢失音频帧,其中正弦分析包含识别音频信号的正弦分量的频率,向先前接收的或重构的音频信号的分段应用正弦模型,其中所述分段用作原型帧以便创建针对丢失音频帧的替代帧,以及响应于对应的识别的频率,通过直到丢失音频帧的时刻对原型帧的正弦分量进行时间演化来创建针对丢失音频帧的替代帧(83)。

Audio frame loss concealment

A lost audio frame of a received audio signal is concealed by specifying a sine analysis (81) on a portion of the previously received or reconstructed audio signal, in which the sine analysis includes the frequency of identifying the sine component of the audio signal, and the sine model is applied to the segments of the previously received or reconstructed audio signal, wherein the segments are used as the original. Type frame to create an alternative frame for a lost audio frame and to create an alternative frame (83) for a lost audio frame by temporal evolution of the sinusoidal component of the prototype frame up to the time of the lost audio frame in response to the corresponding identified frequency.

【技术实现步骤摘要】
音频帧丢失隐藏分案说明本申请是申请日为2014年1月22日、申请号为201480007537.9、专利技术名称为“音频帧丢失隐藏”的专利技术专利申请的分案申请。
本专利技术总体上涉及一种隐藏接收的音频信号的丢失音频帧的方法。本专利技术还涉及一种被配置为隐藏接收的编码音频信号的丢失音频帧的解码器。本专利技术还涉及包括一种解码器的接收机,以及计算机程序和计算机程序产品。
技术介绍
传统的音频通信系统以帧来传输语音和音频信号,这意味着发送侧首先将音频信号设置为例如20=40ms的短的分段,即音频信号帧,短的分段随后被编码并作为逻辑单元在例如传输包中传输。接收侧的解码器对这些单元中的每个单元进行解码,并且重构对应的音频信号帧,该音频信号帧继而最后作为重构音频信号样本的连续序列来输出。在编码之前,模数(A/D)转换可以将来自麦克风的模拟语音或音频信号转换成数字音频信号样本的序列。相反地,在接收端,最终的D/A转换步骤典型地将重构的数字音频信号样本的序列转换成时间连续的模拟信号,以用于扬声器回放。然而,针对语音和音频信号的传统传输系统可能会遭受传输错误,这可能导致传输的帧中的一个或若干个不可用于在接收侧进行重构的情况。在这种情况下,解码器必须生成针对每个不可用帧的替代信号。这可以通过在接收侧的解码器中的所谓的音频帧丢失隐藏单元来执行。帧丢失隐藏的目的是使得尽可能听不到帧丢失,并且因此减轻帧丢失对重构的信号质量造成的影响。传统的帧丢失隐藏方法可以取决于编解码器的结构或构造,例如通过重复先前接收的编解码器参数。这样的参数重复技术显然取决于使用的编解码器的具体参数,并且可能不容易适用于具有不同结构的其它编解码器。当前的帧丢失隐藏方法可以例如冻结并外插(extrapolate)之前接收的帧的参数,以便生成针对丢失帧的替代帧。标准化的线性预测编解码器AMR和AMR-WB是参数化的语音编解码器,其冻结早先接收的参数或使用对参数的外插来进行解码。本质上,原则是取得针对编码/解码的给定模型,并且利用冻结或外插的参数来应用相同的模型。很多音频编解码器应用编码频域技术,该技术包括在频域变换之后向谱参数应用编码模型。解码器根据接收的参数来重构信号谱,并且将谱变换回时间信号。典型地,时间信号是逐帧重构的,并且这些帧通过重叠添加技术和可能的进一步处理来组合以形成最后的重构信号。对应的音频帧丢失隐藏针对丢失帧来应用相同或至少部分类似的解码模型,其中冻结或者适当地外插来自先前接收的帧的频域参数,然后在频率到时间域转换中使用。然而,传统的音频帧丢失隐藏方法可能遭受质量减损,例如由于参数冻结和外插技术和针对丢失帧的相同解码器模型的重应用并不能始终保证从先前解码的信号帧到丢失帧的平滑和忠实的信号演化。这可能导致具有对应的质量影响的可听信号中断。因此,人们期望并需要质量损害减小的音频帧丢失隐藏。
技术实现思路
本专利技术的实施例的目的是至少处理一些上文概述的问题,并且该目的和其它目的是通过根据附加独立权利要求的方法和装置以及通过根据从属权利要求的实施例来实现的。根据一方面,实施例提供了一种用于隐藏丢失音频帧的方法,该方法包括对先前接收的或重构的音频信号的部分执行正弦分析,其中正弦分析包括识别音频信号的正弦分量的频率。此外,向先前接收的或重构的音频信号的分段应用正弦模型,其中所述分段用作原型帧,以便创建针对丢失音频帧的替代帧。替代帧的创建包括响应于对应的识别的频率来进行的原型帧的正弦分量进行时间演化,直到丢失音频帧的时刻。根据第二方面,实施例提供了一种被配置为隐藏接收的音频信号的丢失音频帧的解码器,该解码器包括处理器和存储器,存储器包含能够由处理器执行的指令,借由此所述解码器被配置为:对先前接收的或重构的音频信号的部分执行正弦分析,其中所述正弦分析包括识别音频信号的正弦分量的频率。解码器被配置为向先前接收的或重构的音频信号的分段应用正弦模型,其中所述分段用作原型帧,以便创建针对丢失音频帧的替代帧,以及通过响应于对应的识别的频率,对原型帧的正弦分量进行时间演化,直到丢失音频帧的时刻,来创建针对所述丢失音频帧的替代帧。根据第三方面,实施例提供了一种解码器,被配置为隐藏接收的音频信号的丢失音频帧,该解码器包括输入单元以及帧丢失隐藏单元,所述输入单元被配置为接收编码的音频信号,所述帧丢失隐藏单元包括用于对先前接收的或重构的音频信号的部分执行正弦分析的装置,其中所述正弦分析包括识别所述音频信号的正弦分量的频率。帧丢失隐藏单元还包括用于向先前接收的或重构的音频信号的分段应用正弦模型的装置,其中所述分段用作原型帧,以便创建针对丢失音频帧的替代帧。帧丢失隐藏单元还包括用于通过响应于对应的识别的频率,对原型帧的正弦分量进行时间演化,直到所述丢失音频帧的时刻,来创建针对丢失音频帧的替代帧的装置。解码器可以在诸如移动电话之类的设备中实现。根据第四方面,实施例提供了一种接收机,该接收机包括根据上述第二和第三方面中的任一方面所述的解码器。根据第五方面,实施例提供了一种计算机程序,被定义用于隐藏丢失音频帧,其中该计算机程序包括指令,指令在由处理器运行时使得处理器与上述第一方面一致地隐藏丢失音频帧。根据第六方面,实施例提供了一种计算机程序产品,该计算机程序产品包括存储了根据上述第五方面的计算机程序的计算机可读介质。本文描述的实施例的优点是提供了一种帧丢失隐藏方法,使得能够减轻在音频信号(例如编码的语音)的传输中的帧丢失的听得见的影响。大体的优点是提供了针对丢失帧的重构信号的平滑且忠实的演化,其中与传统技术相比,大大地减小了帧丢失的听得见的影响。在阅读以下描述和附图时,本申请的实施例中教义的其它特征和优点将变得更加清楚。附图说明将参照附图更详细地描述实施例,在附图中:图1示出了典型的窗函数;图2示出了特定的窗函数;图3显示了窗函数的幅度谱的示例;图4示出了具有频率fk的示例性正弦信号的线谱;图5示出了具有频率fk的加窗的正弦信号的谱;图6示出了基于分析帧的与DFT的网格点的幅度相对应的条形图;图7示出了与DFT网格点拟合的抛物线;图8是根据实施例的方法的流程图;图9和图10a-图10b示出了根据实施例的解码器,以及图11示出了根据实施例的计算机程序和计算机程序产品。具体实施方式在下文中,将更详细地描述本专利技术的实施例。为了说明而非限制的目的,公开了特定细节,例如具体场景和技术,以便提供充分的理解。此外,显而易见的是,述示例性方法和设备可以通过使用与编程的微处理器或通用计算机结合起作用的软件和/或使用特定用途集成电路(ASIC)来实现。此外,实施例还可以至少部分地实现为计算机程序产品,或者在包括计算机处理器和耦合到处理器的存储器的系统中实现,其中存储器可以使用可以执行本文公开的功能的一个或多个程序来编码。下文描述的实施例的思想包括通过以下操作来隐藏丢失音频帧:-对先前接收或重构的音频信号的至少一部分执行正弦分析,其中该正弦分析包括识别音频信号的正弦分量的频率;-向先前接收的或重构的音频信号的分段应用正弦模型,其中所述分段用作原型帧,以便创建针对丢失音频帧的替代帧,以及-创建替代帧,包括响应于对应的识别的频率来对原型帧的正弦分量进行时间演化,直到丢失音频帧的时刻。正弦分析根据实施例的帧丢失隐藏包括对先前本文档来自技高网
...
音频帧丢失隐藏

【技术保护点】
1.一种帧丢失隐藏方法,其中先前接收或重构的音频信号的分段用作原型帧以创建针对丢失音频帧的替代帧,所述方法包括:‑将原型帧变换到频域;‑将正弦模型应用于原型帧以识别音频信号的正弦分量的频率;‑计算针对所识别的正弦分量的相移θk;‑将所识别的正弦分量相位偏移θk;‑通过执行原型帧的频谱的频率逆变换来创建替代帧;其特征在于‑将所识别的正弦分量相位偏移包括:将包括在正弦波k附近的区间Mk中的原型帧的所有谱系数的相位偏移θk;‑未被相移的谱系数的相位被随机化;以及‑原型帧的幅度谱保持不变。

【技术特征摘要】
2013.02.05 US 61/760,8141.一种帧丢失隐藏方法,其中先前接收或重构的音频信号的分段用作原型帧以创建针对丢失音频帧的替代帧,所述方法包括:-将原型帧变换到频域;-将正弦模型应用于原型帧以识别音频信号的正弦分量的频率;-计算针对所识别的正弦分量的相移θk;-将所识别的正弦分量相位偏移θk;-通过执行原型帧的频谱的频率逆变换来创建替代帧;其特征在于-将所识别的正弦分量相位偏移包括:将包括在正弦波k附近的区间Mk中的原型帧的所有谱系数的相位偏移θk;-未被相移的谱系数的相位被随机化;以及-原型帧的幅度谱保持不变。2.根据权利要求1所述的帧丢失隐藏方法,其中,相移θk取决于正弦频率fk以及原型帧与丢失帧之间的时间偏移。3.一种用于创建针对丢失音频帧的替代帧的设备(13),所述设备包括:-用于根据先前接收或重构的音频信号的分段生成原型帧的装置;-用于将...

【专利技术属性】
技术研发人员:斯蒂芬·布鲁恩
申请(专利权)人:瑞典爱立信有限公司
类型:发明
国别省市:瑞典,SE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1