System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于去除不期望的听觉粗糙度的装置和方法制造方法及图纸_技高网

用于去除不期望的听觉粗糙度的装置和方法制造方法及图纸

技术编号:40778722 阅读:4 留言:0更新日期:2024-03-25 20:23
一种根据实施例的用于处理音频输入信号以获得音频输出信号的装置(100)。该装置(100)包括信号分析器(110),该信号分析器(110)被配置用于确定关于音频输入信号的一个或多个频谱带的听觉粗糙度的信息。此外,装置(100)包括信号处理器(120),该信号处理器(120)被配置用于取决于关于一个或多个频谱带的听觉粗糙度的信息来处理音频输入信号。

【技术实现步骤摘要】
【国外来华专利技术】

本专利技术涉及一种用于去除不期望的听觉粗糙度的装置和方法


技术介绍

1、在非常低的比特率下的感知音频编解码中,有时会在包含清晰音调分量的音频信号中引入调制伪音。这些调制伪音通常被感知为听觉粗糙度(auditory roughness)。这可以是由于量化误差或由于音频带宽扩展造成的,其中音频带宽扩展导致复制频谱带的边缘处的不规则谐波结构。特别地,在对音调分量进行编码时不投入相当多的比特的情况下,难以克服由于量化误差而引起的粗糙度伪音。

2、在低比特率音频编解码中,使用音频信号的高效表示,与原始的、未压缩的16比特采样pcm音频信号相比,音频信号的高效表示需要少得多的数字信息。对于现代变换编码器(如xhe-aac和mpeg-h),通过使用mdct将原始输入音频信号变换为时频域表示来部分地获得效率,其中,每个音频帧可以用由心理声学模型监督并受到可用比特预算约束的可变精度来表示。通过在编码过程期间应用这两种控制机制,结果将是其中量化噪声跨时间帧和频谱带变化的音频比特流。

3、在理想情况下,在编码器侧,量化噪声被整形为使得由于听觉掩蔽而导致其变得听不见。然而,对于非常低的比特率,量化噪声将在某个时间点变得可听见,特别是如果音频信号中存在具有长持续时间的音调分量。原因是:对这些音调分量进行量化可能引起跨音频帧的幅度变化,这可以导致可听见的幅度调制。对于43hz的典型变换编码器音频帧速率,这些调制将以该速率的最多一半的速率被添加到信号中。这低于引起粗糙度感知但在引起(慢)r-粗糙度的范围内的调制速率。此外,由于用于将时域音频帧变换到频域的短期加窗,完美的、固定的音调分量将在一系列相邻频率区间内表示,其中,该一系列相邻频率区间中的一些很容易被量化为零,尤其是在非常低的比特率下。

4、通过附加的半参数化技术(如与xhe-aac一起使用的频谱带复制(sbr)[1]、或与mpeg-h一起使用的智能间隙填充(igf)[2]),可以将比特率降低到对于纯变换编码器的良好音频质量所需的范围以下。使用低频频谱的移位副本和频谱包络整形来重建高频分量。分别利用sbr或igf,可以保持良好的音频质量。

5、然而,由于音调频率分量与已经存在的时间调制一起被复制,因此sbr和igf可能会放大粗糙度伪音。

6、此外,这些技术可能会引入新的粗糙度伪音,特别是在复制频谱带之间的过渡区域中:在许多音频帧中,原始信号中存在的规则谐波网格可能存在偏差。最近的研究表明,使用心理声学模型来自适应地决定最佳复制映射可以提高音频质量[5]。

7、用于抑制音调信号中的噪声的后滤波方法部分地去除信号中的粗糙度。所述方法依赖于基频的测量并通过应用调谐到基频的梳状滤波器来去除噪声,或者依赖于预测编解码,例如长期预测器(ltp)。所有这些方法仅适用于单音高信号,并且无法对展现出许多音高的复调或非谐波内容进行降噪。此外,该方法无法区分存在于原始信号中的噪声或由于编码-解码过程而引入的噪声。

8、因此,非常期望能够提供用于听觉粗糙度去除的改进构思。


技术实现思路

1、本专利技术的目的在于提供用于听觉粗糙度去除的改进构思。通过根据权利要求1的装置、通过根据权利要求27的音频编码器、通过根据权利要求38的方法、通过根据权利要求39的方法、以及通过根据权利要求40的计算机程序来实现本专利技术的目的。

2、一种根据实施例的用于处理音频输入信号以获得音频输出信号的装置。该装置包括信号分析器,其被配置用于确定关于音频输入信号的一个或多个频谱带的听觉粗糙度的信息。此外,该装置包括信号处理器,其被配置用于根据关于一个或多个频谱带的听觉粗糙度的信息来处理音频输入信号。

3、此外,一种根据实施例的用于对初始音频信号进行编码以获得编码音频信号和辅助信息的音频编码器。该音频编码器包括用于对初始音频信号进行编码以获得编码音频信号的编码模块。此外,该音频编码器包括辅助信息生成器,其用于根据初始音频信号并进一步根据编码音频信号来生成并输出辅助信息。辅助信息包括指示,该指示对多个频谱带中的一个或多个频谱带进行指示,其中针对该一个或多个频谱带将在解码器侧确定关于听觉粗糙度的信息。

4、此外,提供了一种根据实施例的用于处理音频输入信号以获得音频输出信号的方法。该方法包括:

5、-确定关于音频输入信号的一个或多个频谱带的听觉粗糙度的信息;以及

6、-根据关于一个或多个频谱带的听觉粗糙度的信息来处理音频输入信号。

7、此外,一种用于对初始音频信号进行编码以获得编码音频信号和辅助信息的方法。该方法包括:

8、-对初始音频信号进行编码以获得编码音频信号;以及

9、-根据初始音频信号并进一步根据编码音频信号来生成并输出辅助信息。

10、辅助信息包括指示,该指示对多个频谱带中的一个或多个频谱带进行指示,其中针对该一个或多个频谱带将在解码器侧确定关于听觉粗糙度的信息。

11、此外,提供了计算机程序,其中每个计算机程序被配置为当在计算机或信号处理器上执行时实现上述方法之一。

12、除此之外,本专利技术还基于如下发现:特别是在对音调分量进行编码时不投入相当多的比特的情况下,难以缓解由于量化误差而引起的粗糙度伪音。实施例提供了新颖且具有创造性的概念来去除在解码器侧的由编码器发送的少量引导信息所控制的这些粗糙度伪音。

13、一些实施例基于如下发现:在逐帧的基础上,很难看到跨连续帧发生的幅度调制,人类听觉系统仍然将它们感知为粗糙度伪音,因为它跨比音频编解码中使用的典型帧长度长的时间跨度来评估音频信号。在一些实施例中,可以例如利用更长的帧长度来分析解码音频信号,使得音调分量中存在的幅度调制伪音在幅度频谱中作为在主音调分量旁边出现的侧频谱带或者甚至侧峰值而变得更加可见。

14、考虑到这种侧峰值的出现,原则上将可以检测这些侧峰值并将它们从频谱中去除。初始实验已经表明,这确实是可以完成的,并且作为结果,极大地减少了粗糙度伪音。

15、然而,盲目地去除这种侧峰值可能导致对音频信号引入不期望的可听变化。例如,考虑包括本身非常粗糙的信号部分的原始音频信号。在这种情况下,不应去除粗糙度。确实发现,盲目应用侧峰值去除确实会导致音频信号部分中出现清晰可听见的“管状”伪音,这些伪音具有非常类似噪声或密集填充的频谱。

16、为了克服上述问题,似乎需要选择性地进行侧峰值去除,即仅在音频信号的其中编码和解码过程导致粗糙度伪音的那些部分中进行侧峰值去除。由于该决策与这种伪音的感知相关,因此这种决策可以由心理声学模型驱动,该心理声学模型将原始信号和解码信号进行比较以确定在哪些时频区域中引入了粗糙度伪音。

17、为了去除上述粗糙度伪音,提供了一种使用对幅度调制敏感的心理声学模型的方法。该模型基于dau等人的[3]模型,但包括已经在[4]中描述并稍后将详细介绍的多个修改。心理声学模型做出的关于是否应去除粗糙度伪音的决策可本文档来自技高网...

【技术保护点】

1.一种用于处理音频输入信号以获得音频输出信号的装置(100),其中,所述装置(100)包括:

2.根据权利要求1所述的装置(100),

3.根据权利要求1或2所述的装置(100),

4.根据权利要求3所述的装置(100),

5.根据权利要求4所述的装置(100),

6.根据权利要求3至5之一所述的装置(100),

7.根据前述权利要求之一所述的装置(100),

8.根据前述权利要求之一所述的装置(100),

9.根据权利要求8所述的装置(100),

10.根据权利要求9所述的装置(100),

11.根据权利要求9或10所述的装置(100),

12.根据权利要求7或根据权利要求10或11所述的装置(100),

13.根据权利要求12所述的装置(100),

14.根据前述权利要求之一所述的装置(100),

15.根据权利要求14所述的装置(100),

16.根据权利要求1 4或15所述的装置(100),</p>

17.根据权利要求14至16之一所述的装置(100),

18.根据权利要求14所述的装置(100),

19.根据权利要求18所述的装置(100),

20.根据权利要求18和19所述的装置(100),

21.根据权利要求20所述的装置(100),

22.根据权利要求21所述的装置(100),

23.根据权利要求14至22之一所述的装置(100),

24.一种用于从编码音频信号生成音频输出信号的装置(200),其中,所述装置(200)包括:

25.根据权利要求24所述的装置(200),

26.根据权利要求24或25所述的装置(200),

27.一种音频编码器(300),用于对初始音频信号进行编码以获得编码音频信号和辅助信息,其中,所述音频编码器(300)包括:

28.根据权利要求27所述的音频编码器(300),

29.根据权利要求28所述的音频编码器(300),

30.根据权利要求27至29之一所述的音频编码器(300),

31.根据权利要求30所述的音频编码器(300),

32.根据权利要求27至31之一所述的音频编码器(300),

33.根据权利要求27至32之一所述的音频编码器(300),

34.根据权利要求33所述的音频编码器(300),

35.根据权利要求27至34之一所述的音频编码器(300),

36.根据权利要求35所述的音频编码器(200),

37.一种系统,包括:

38.一种用于处理音频输入信号以获得音频输出信号的方法,其中,所述方法包括:

39.一种用于对初始音频信号进行编码以获得编码音频信号和辅助信息的方法,其中,所述方法包括:

40.一种计算机程序,用于当在计算机或信号处理器上执行时实现根据权利要求38或39所述的方法。

...

【技术特征摘要】
【国外来华专利技术】

1.一种用于处理音频输入信号以获得音频输出信号的装置(100),其中,所述装置(100)包括:

2.根据权利要求1所述的装置(100),

3.根据权利要求1或2所述的装置(100),

4.根据权利要求3所述的装置(100),

5.根据权利要求4所述的装置(100),

6.根据权利要求3至5之一所述的装置(100),

7.根据前述权利要求之一所述的装置(100),

8.根据前述权利要求之一所述的装置(100),

9.根据权利要求8所述的装置(100),

10.根据权利要求9所述的装置(100),

11.根据权利要求9或10所述的装置(100),

12.根据权利要求7或根据权利要求10或11所述的装置(100),

13.根据权利要求12所述的装置(100),

14.根据前述权利要求之一所述的装置(100),

15.根据权利要求14所述的装置(100),

16.根据权利要求1 4或15所述的装置(100),

17.根据权利要求14至16之一所述的装置(100),

18.根据权利要求14所述的装置(100),

19.根据权利要求18所述的装置(100),

20.根据权利要求18和19所述的装置(100),

21.根据权利要求20所述的装置(100),

22.根据权利要求21所述的装置(100),

23...

【专利技术属性】
技术研发人员:萨沙·迪施史蒂文·范德帕安德鲁斯·尼德梅尔贝恩德·埃德勒
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1