基于子窗口序列内的RMS功率的音频文件包络制造技术

技术编号:24218801 阅读:81 留言:0更新日期:2020-05-20 20:32
一种方法包括基于音频文件的双窗口化分析来确定音频文件的包络。

Envelope of audio file based on RMS power in sub window sequence

【技术实现步骤摘要】
【国外来华专利技术】基于子窗口序列内的RMS功率的音频文件包络
本公开总体上涉及音频处理领域,例如,音乐和广播制作、分发和传输。
技术介绍
数字音频工作站(DAW)是一种电子装置或软件应用程序,用于录制、编辑和生成音频文件,例如,音乐作品、语音或声音效果。DAW通常提供一个用户接口,允许用户录制、编辑多个录制和轨道,并将其混合成一个最终制作的作品。音乐制作包括录制、混合和掌握的处理。基于计算机的DAW通常允许音频的多轨道录制,并提供播放、录制和编辑音轨的控制。现代的基于计算机的DAW支持软件插件,每个插件都有自己的功能,可以扩展DAW的声音处理能力。例如,存在用于均衡、限制和压缩的软件插件。也存在提供音频效果的软件插件,例如,混响和回声。并且存在为DAW提供声源的软件插件,例如,虚拟仪器和采样器。数字音频处理可能涉及响度评估,尤其是短期响度评估(=包络评估)。欧洲广播联盟(EBU)(参见参考文献[EBU2011])研究了广播节目的制作、分发和传输中对音频信号电平的需求。普遍需要在录制、混合和监控处理中为用户提供更好的计算机实施方式的辅助。
技术实现思路
根据第一方面,本公开提供了一种方法,包括基于音频文件的双窗口化分析来确定音频文件的包络。根据另一方面,本公开提供了一种电子装置,包括被配置为基于音频文件的双窗口化分析来确定音频文件的包络的电路。根据另一方面,本公开提供了一种包括指令的计算机程序,当在处理器上执行时,该指令使得处理器基于音频文件的双窗口化分析来确定音频文件的包络。在从属权利要求、以下描述和附图中阐述了进一步的方面。附图说明通过参考附图的示例来解释实施方式,其中:图1描述了滑动窗口如何包含信号和背景噪声两者;图2a示出了在信号和背景噪声之间转换的示例性源音频文件的幅度;图2b示出了用单窗口化处理方法确定的图2a的源音频文件的包络,其导致转换期间的响度被低估;图3示意性地描述了包括双窗口化的短期响度评估处理;图4示意性地描述了包括双窗口化(没有心理声学加权)的短期电平评估处理;图5示意性地描述了双窗口化处理的第一种可能的实施方式,包括丢弃低响度子窗口,随后是剩余音频的级联和剩余音频的RMS功率的评估;图6示出了根据图5的关于满量程正弦波在背景噪声之后的序列的实施方式;图7示意性地描述了双窗口化处理的第二种可能实施方式,其包括丢弃低响度子窗口,随后评估剩余子窗口的平均RMS功率;图8示意性地描述了双窗口化处理的第三种可能实施方式,其包括使用响度值本身作为系数来评估子窗口化的响度的加权平均值;图9示出了图8关于满量程正弦波跟随背景噪声的序列的实施方式;图10以包络跟随器的形式示意性地描述了音频文件的包络评估的示例应用;图11a-图11c示出了双窗口化处理如何在转换期间降低处理过的音频中的较高响度;图12示意性地描述了以两个相等电平的轨道相加的形式的音频文件的包络评估的示例应用;图13示意性地描述了双窗口化处理的实施方式,该处理包括丢弃低响度子窗口,随后是剩余音频的级联和剩余音频的RMS功率的评估,以及锚定时间的评估;图14示出了根据图13的关于满量程正弦波在背景噪声之后的序列的实施方式;图15示意性地描述了双窗口化处理的实施方式,包括丢弃低响度子窗口,随后是剩余子窗口的平均RMS功率的评估以及锚定时间的评估;图16示意性地描述了双窗口化处理的进一步实施方式,包括使用响度值本身作为系数来评估子窗口化的响度的加权平均值以及评估锚定时间;图17示出了图16关于满量程正弦波在背景噪声之后的序列的实施方式;图18示出了与分别使用图5、图7和图8的实施方式测量的响度的位置和值相比,利用如关于图13、图15和图16的实施方式所描述的、位于锚点处的双窗口化而测量的响度的位置和值;图19以包络跟随器的形式示意性地描述了音频文件的包络评估的另一示例应用;以及图20示意性地描述了用于实施处理的电子装置的实施方式。具体实施方式以下实施方式涉及电平和/或响度评估框架,尤其涉及从音频文件中找到窗口(瞬时或短期)电平和/或响度值。实施方式公开了一种方法,其包括基于音频文件的双窗口化分析来确定音频文件的包络。该双窗口化分析可以包括对源音频文件进行窗口化,以获得包含音频的窗口序列,并且对窗口序列的每个窗口进行窗口化,以获得每个窗口的相应子窗口序列。将窗口序列的每个窗口进行窗口化成子窗口,可以产生响度曲线,响度曲线的每个值是从相应的窗口获得的。将窗口序列的每个窗口进行窗口化成子窗口,可以产生电平曲线,从相应的窗口获得电平曲线的每个值。上述方法可以例如集成到文件的窗口化的响度评估中。上述方法可以例如集成到包络跟随器中。上述方法可以例如应用于自动音频混合框架中。这些方法可以是计算机实施的方法。例如,这些方法可以实施为软件应用、数字音频工作站(DAW)软件应用等。这些方法也可以实施为软件插件,例如,用于数字音频工作站软件。这些方法可以例如在电子装置中实施方式,该电子装置包括被配置为执行以上和以下更详细描述的方法的电路。电子装置例如可以是计算机、台式计算机、工作站、数字音频工作站(DAW)等。电子装置也可以是膝上型电脑、平板电脑、智能手机等。电子装置的电路可以包括一个或多个处理器、一个或多个微处理器、专用电路、逻辑电路、存储器(RAM、ROM等)、存储器、输出装置(显示器,例如,液晶、(有机)发光二极管等)、扬声器、接口(例如,触摸屏、无线接口,例如,蓝牙、红外线、音频接口等)等。响度的窗口化测量欧洲广播联盟(EBU)为音频内容的窗口化的响度提供规范[EBU2011]。窗口化的响度或包络的测量包括心理声学加权音频的窗口化,随后评估每个窗口中音频的均方根(RMS)功率。也可以对未加权的音频执行评估窗口音频的RMS功率的处理,在这种情况下,评估是对窗口功率的评估而不是窗口化的响度的评估。在窗口内的低电平和高电平音频之间存在转换的情况下,对每个窗口中音频的RMS功率进行窗口化和评估都会导致响度和功率估计的误差。图1示出了应用于正弦波的窗口化处理。当正弦波开始或结束时,几个窗口(例如,图1中的窗口2和窗口3)包含信号和背景噪声两者。这些窗口的测量电平低于仅包含信号的窗口的测量电平(见图2b)。图2a示出了具有信号和背景噪声之间的转换的示例性源音频文件的幅度。其显示了背景噪声与满量程正弦波交替出现的示例轨道(“源”)。图2b示出了用单窗口化处理方法确定的图2a的源音频文件的包络。该图显示了在该示例轨道上执行电平窗口化测量的结果。转换期间的电平被低估。假设操作(例如,包络跟随器)旨在将示例轨道设置为恒定的目标响度,则上述较低的响度值将导致局部较高的增益,并因此在转换期间以较高信号电平的形式产生伪像本文档来自技高网...

【技术保护点】
1.一种方法,包括基于音频文件的双窗口化分析来确定音频文件的包络。/n

【技术特征摘要】
【国外来华专利技术】20171006 EP 17195346.61.一种方法,包括基于音频文件的双窗口化分析来确定音频文件的包络。


2.根据权利要求1所述的方法,其中,所述双窗口化分析包括对源音频文件进行窗口化,以获得包含音频的窗口序列,并且对所述窗口序列的每个窗口进行窗口化,以获得所述每个窗口的相应子窗口序列。


3.根据权利要求2所述的方法,其中,从所述窗口序列确定所述包络包括:丢弃响度低于阈值的子窗口,并通过剩余音频来评估所述每个窗口的响度。


4.根据权利要求2所述的方法,其中,从所述窗口序列确定所述包络包括:为所述每个窗口确定在所述每个窗口中的所述子窗口的响度的加权平均值,其中,系数是所述子窗口的响度值。


5.根据权利要求1所述的方法,还包括根据源音频文件确定响度曲线。


6.根据权利要求1所述的方法,其中,所...

【专利技术属性】
技术研发人员:伊曼纽尔·德吕蒂
申请(专利权)人:索尼欧洲有限公司
类型:发明
国别省市:英国;GB

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1