用于通过装置进行音频渲染的方法制造方法及图纸

技术编号:34942903 阅读:18 留言:0更新日期:2022-09-17 12:17
一种用于由包括至少一个音频渲染设备的装置进行音频渲染的方法,该方法包括:从输入音频信号中提取(S10)多个频带分量;根据设备频率响应和多个所提取的频带分量来确定(S15)表示掩蔽频率能量的至少一个指示符,掩蔽频率对应于高于频率阈值的频带;根据表示掩蔽频率能量的指示符确定至少一个校正因子(S16);e)对于每个频带,通过利用校正因子修改(S17)与所述频带相关联的预定第一声级阈值来确定第二声级阈值(S20),并且根据所提取的频带的声级和关联到所述所提取的频带的第二声级阈值之间的比较(S30)来确定降低增益,并且应用(S40)降低增益。(S40)降低增益。(S40)降低增益。

【技术实现步骤摘要】
【国外来华专利技术】用于通过装置进行音频渲染的方法
[0001]专利技术的上下文和
技术介绍

[0002]本专利技术涉及一种用于通过包括至少一个音频渲染设备的装置进行音频渲染的方法。
[0003]音频渲染设备是接收音频数据并播放对应于所接收的音频数据的声音的设备。典型地,音频渲染设备是扬声器,即,将电音频信号转换成相对应的声音的电声换能器。
[0004]许多现代电子装备设置有嵌入式扬声器,以允许用户收听许多类型的内容。例如,该装置可以是笔记本电脑、平板电脑或智能手机。为了最小化这种装置的大小,制造商通常选择较小的扬声器,这导致低响度。制造商已经试图设计包含扬声器的盒并且实施其他声学优化以利用共振现象以便提高低频率的声级,但是这是不够的。此外,较高频率的声级往往是不够的。这导致声音的低响度和较差的平衡性。
[0005]嵌入式扬声器的低响度通常使用放大器来补偿。这通常导致扬声器压力过大,从而导致在所渲染的声音中诸如失真或蜂鸣的伪迹。通过使用多种效果(诸如均衡、压缩器或限幅器),可以提高所渲染的声音的响度和平衡性,同时限制对扬声器的约束。这些效果可以在硬件中实施(例如利用所谓的智能放大器);或者在软件中利用处理方法实施。附加地,智能放大器监控扬声器偏移和扬声器温度,以调适放大增益,并且因此避免压力过大。
[0006]此外,扬声器通常与其他组件(诸如当音频内容在扬声器上播放时可能振动的键盘按键)绝缘不良。这些振动是可听的,并且使得收听者对声音质量的整体感知劣化,即使在具有良好的响度和平衡性的情况下。智能放大器没有考虑扬声器的环境;它们只是为了解决扬声器的压力过大、响度和平衡性,并且因此无助于减少这种类型的声音劣化。
[0007]振动通常是由于音频内容的激励频率(例如,349Hz、740Hz)的有限列表导致的。简单的处理包含对涵括有问题频率的频带的声级施加固定的降低增益,例如通过应用陷波滤波器或频带切割器(具有非常窄的频带)。然而,这种方法可能使由收听者感知的声音的质量劣化。
[0008]专利US9762198描述了一种用于动态调节压缩机的阈值的方法。处理具有多个频带分量的输入音频信号。可以确定时变阈值。压缩器对每个频带分量执行具有相对应的时变阈值的压缩操作,以产生增益。每个增益被应用于延迟的相对应的频带分量,以产生经处理的频带分量,这些分量被求和以产生输出信号。在一些实施方式中,例如使用基于谐波的生成的失真可听度模型,确定输出信号的所感知的频谱的时变估计和由所感知的频谱估计引起的失真频谱的时变估计。这个模型可以通过预先在设备上进行测量来获得。然而,这种方法不能准确反映每个扬声器的行为。同一模型的样本之间存在太多差异,并且在同一设备上进行的两个测量之间也存在太多差异。也可以通过偏移更简单地估计模型,但是这导致太多近似。而且,失真的可听度是通过心理声学掩蔽的估计来计算的。此外,这种计算非常需要资源,并且因此需要近似来减轻计算。因此,很大程度地使这个结果劣化。此外,对其应用增益的频带与用于阈值的频带相同。然而,频带可以包含各种不同的声音,并且这种减少导致对音频内容的音调的明显影响。
[0009]专利申请US2019/075395描述了一种方法,其中音频信号的频谱倾斜被用于确定
扬声器是否将在音频信号的回放期间引入可感知的失真。频谱倾斜是指音频信号中能量如何在频谱上分布。可以通过确定产生失真的频带中的能量和掩蔽失真的频带中的能量之间的比率来指示频谱倾斜。基于所确定的频谱倾斜,可以使产生失真的频带衰减,以减少由扬声器引入的失真。更具体地,信号电平在输入音频信号的衰减频带中衰减,以基于输入音频信号的掩蔽失真的频带的信号电平和掩蔽失真的频带的信号电平之间的比率产生经修改的音频信号。

技术实现思路

[0010]本专利技术提出在保持最佳可能响度和平衡性的同时(即通过最小化对所渲染的声音的影响),制造不可听伪迹,诸如振动、失真或蜂鸣。为此,该方法仅在必要时以取决于声音的内容的动态方式调适声音。
[0011]为此,本专利技术是一种用于通过包括至少一个音频渲染设备的装置进行音频渲染的方法,该方法包括:
[0012]a)接收输入音频信号,
[0013]b)从输入音频信号中提取多个频带分量,每个频带分量具有与频带相关联的声级,
[0014]c)根据多个所提取的频带分量确定表示掩蔽频率能量的至少一个指示符,掩蔽频率对应于高于频率阈值的频带,表示掩蔽频率能量的指示符仅根据高于频率阈值的频带确定,
[0015]d)根据表示掩蔽频率能量的所述至少一个指示符确定至少一个校正因子,
[0016]e)针对每个频带,通过利用校正因子修改与所述频带相关联的预定第一声级阈值来确定第二声级阈值,其中第一声级阈值独立于输入音频信号的内容,所述第一声级阈值指示该频带的可以由该装置播放而没有明显的伪迹的最高声级,并且其中第二声级阈值取决于输入音频信号,
[0017]f)针对每个频带,根据所述频带的所提取的频带分量的声级和与所述提取的频带相关联的第二声级阈值之间的比较来确定降低增益,以及
[0018]g)将降低增益应用于频带分量的声级,
[0019]h)将不同频带分量转换成输出音频信号,
[0020]i)由音频渲染设备对输出音频信号进行音频渲染。
[0021]该方法使得可以在场景允许其的情况下限制振动减少的使用。例如,当在感知上不必要时,即,当场景的音频水平与振动的所估计的音频水平相比足够高时,该方法将应用很少减少或不应用减少,并且因此可以从感知的视角将其掩蔽。以这样的方式,音频内容被较少地改变,具有更高的音频渲染保真度。
[0022]本专利技术方法的其它优选但非限制性的各方面如下是独立的或呈技术上可行的组合的形式:
[0023]‑
音频渲染设备具有预定的设备频率响应,并且表示掩蔽频率能量的指示符也根据设备频率响应进行确定;
[0024]‑
频率阈值高于或等于6kHz,优选地高于或等于8kHz,并且更优选高于或等于10kHz;
[0025]‑
确定表示掩蔽频率能量的多个指示符,表示掩蔽频率能量的指示符根据对应于由不同频率阈值限定的不同频率子范围的频带确定;
[0026]‑
根据表示掩蔽频率能量的多个指示符确定几个校正因子,并且不同的校正因子被用于确定不同频带的第二声级阈值,所使用的校正因子取决于频带;
[0027]‑
至少一个频带与表示掩蔽频率能量的几个指示符相关联,并且用于确定与所述频带相关联的第二声级阈值的校正因子根据表示与所述频带相关联的掩蔽频率能量的几个指示符中的至少一个指示符确定;
[0028]‑
根据表示掩蔽频率能量的每个指示符确定校正因子,从而产生与所述频率子范围的频带相关联的多个校正因子;
[0029]‑
通过使用在从与关联于所述第二声级的至少一个频带相关联的多个校正因子当中选择的所选择的校正因子来确定第二声级阈值,所选择的校正因子被选择用于产生在将通过使用多个校正因子来确定的第二本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于通过包括至少一个音频渲染设备的装置进行音频渲染的方法,所述方法包括:a)接收输入音频信号,b)从所述输入音频信号中提取(S10)多个频带分量,每个频带分量具有与频带相关联的声级,c)根据所述多个所提取的频带分量来确定(S15)表示掩蔽频率能量的至少一个指示符,掩蔽频率对应于高于频率阈值的频带,表示掩蔽频率能量的所述指示符仅根据高于所述频率阈值的频带来确定,d)根据表示掩蔽频率能量的至少一个指示符来确定(S16)至少一个校正因子,e)针对每个频带,通过利用所述至少一个校正因子来修改(S17)与所述频带相关联的预定第一声级阈值而确定第二声级阈值(S20),其中所述第一声级阈值独立于所述输入音频信号的内容,所述第一声级阈值指示该频带的能够由所述装置播放而没有明显的伪迹的最高声级,并且其中所述第二声级阈值取决于所述输入音频信号,f)针对每个频带,根据所述频带的所提取的频带分量的声级和与所述频带相关联的第二声级阈值之间的比较(S30)来确定降低增益,以及g)将所述降低增益应用于(S40)所述频带分量的声级,h)将所述不同频带分量转换(S50)成输出音频信号,i)由所述音频渲染设备对所述输出音频信号进行音频渲染(S60)。2.根据权利要求1所述的方法,其中所述音频渲染设备具有预定的设备频率响应,并且表示掩蔽频率能量的所述指示符也根据所述设备频率响应进行确定。3.根据权利要求1或2所述的方法,其中所述频率阈值高于或等于6kHz。4.根据权利要求1至3中任一项所述的方法,其中表示掩蔽频率能量的多个指示符被确定,表示掩蔽频率能量的所述指示符根据对应于由不同频率阈值限定的不同频率子范围的频带来确定。5.根据权利要求4所述的方法,其中根据表示掩蔽频率能量的所述多个指示符来确定几个校正因子,并且不同的校正因子被用于确定不同频带的第二声级阈值,所使用的所述校正因子取决于所述频带。5、根据权利要求3或4中任一项所述的方法,其中至少一个频带关联到表示掩蔽频率能量的几个指示符,并且用于确定与所述频带相关联的第二声级阈值的校正因子根据表示与所述频带相关联的掩蔽频率能量的几个指示符中的至少一个指示符来确定。6.根据权利要求1至5中任一项所述的方法,其中所述频带分量被提取为频带信号分量,并且频带信号分量的声级是所述频带信号分量的幅值,或者其中所述频带分量被提取为频带窗口分量,并且每个频带是频率窗口,并且其中步骤b)包括将所述输入音频...

【专利技术属性】
技术研发人员:达米安
申请(专利权)人:斯蒂尔赛瑞斯法国公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1