用于操纵包括暂态事件的音频信号的装置、方法和计算机程序制造方法及图纸

技术编号:7131548 阅读:166 留言:0更新日期:2012-04-11 18:40
用于操纵包括暂态事件的音频信号(110)的装置(100),该装置(100)包括:暂态信号替换器(130),被配置成用替换信号部分来替换音频信号的包括暂态事件的暂态信号部分,以获得暂态减少音频信号(132),该替换信号部分适应于音频信号的一个或多个非暂态信号部分的信号能量特性,或适应于暂态信号部分的信号能量特性。该装置还包括:信号处理器(140),被配置成处理暂态减少音频信号(132)来获得暂态减少音频信号的经处理(142)。该装置还包括:暂态信号重新插入器(150),被配置成将暂态减少音频信号(132)的经处理版本(142)与以原始或经处理形式表示暂态信号部分的暂态内容的暂态信号相组合。

【技术实现步骤摘要】
【国外来华专利技术】用于操纵包括暂态事件的音频信号的装置、方法和计算机程序
技术介绍
根据本专利技术的实施例涉及用于操纵包括暂态事件的音频信号的装置、方法和计算机程序。在下文中,描述依据本专利技术的实施例可应用的典型的应用情景。在现行的音频信号处理系统中,音频信号通常使用数字技术来处理。例如特定信号部分,诸如暂态部分,对数字信号处理有特殊要求。暂态事件(或“暂态”)是信号中的事件,在该事件期间,整个频带或某一频率范围内信号的能量快速变化,即,其能量快速增加或快速降低。特定暂态(暂态事件)的特征可在频谱中的信号能量分布中得出。典型地,暂态事件期间音频信号的能量在整个频率范围内分布,而在非暂态信号部分中,能量在正常情况下集中在音频信号的低频部分或集中在一个或多个特定频带中。这意味着非暂态信号部分出(也称为稳态或“音调”信号部分)具有非平坦频谱。此外,暂态信号部分的频谱典型的是混沌的且“不可预测的”(例如,当在知晓暂态信号部分之前的信号部分的频谱时)。换言之,信号的能量包括在相对较少的频谱线或频谱带中,它们被强烈加重而超越音频信号的噪声基准。但是在暂态部分中,音频信号的能量将在许多不同的频带内分布且尤其将在高频部分中分布,以致音频信号的暂态部分的频谱相对较平坦且通常将比音频信号的音调部分的频谱平坦。然而,应指出的是,存在有具有平坦频谱的其他类型的信号,例如,像不表示暂态的类噪声信号。然而,尽管类噪声信号的频谱段具有不相关或弱相关的相位值,但是存在暂态的情况下频谱段通常存在有非常显著的相位相关性。典型地,暂态事件是音频信号的时域表示中的强烈变化,其意味着在执行傅立叶分解时信号将包括许多高频分量。许多高次谐波的重要特征是高次谐波的相位具有极其特定的相互关系,以致所有这些谐波的迭加将使信号能量产生快速变化(当在时域中考虑时)。换言之,暂态事件附近的频谱存在有强相关性。所有谐波中的特定相位情况还可被称为“垂直相干性”。此“垂直相干性”与信号的时间/频率谱图表示有关,其中水平方向与信号在时间上演进相对应,垂直维度描述在频率上短时间频谱中对频谱分量的频率的依赖性。例如,若变化在大时域范围内执行,例如,通过量化,则所述变化将影响整个块。因为暂态的特征在于能量的短期增加,所以当块变化时,此能量可能将在该块所表示的整个区域内被涂抹开。当信号的再现速度变化而音高维持不变时,或当信号被转换而原始再现持续时间维持不变时,问题变得尤为明显。使用相位语音编码器或诸如(P)SOLA的方法(参见关于此问题的参考文献至),上述两种情况均可被实现。后者通过再现以时间延展因数加速的经延展信号来实现。在时间离散信号表示下,这与维持采样频率的同时以延展因数来下采样信号相对应。诸如相位语音编码器等时间延展方法实际上仅适于稳态或准稳态信号,因为暂态通过分散在时间上“被涂抹开”。相位语音编码器削弱了信号的所谓垂直相干特性(与时间/频率谱图表示有关)。音频信号的时间延展在娱乐及艺术中均起重要作用。常用的算法基于交叠和相加 (OLA)技术,诸如相位语音编码器(PV)、同步交叠相加(SOLA)、音高同步交叠相加(PSOLA), 以及波形相似性交叠相加(WSOLA)。尽管这些算法能够改变音频信号的重放速度同时保留它们的原始音高,但是暂态未被保留完好。使用OLA在时间上延展音频信号而不改变其音高需要分别处理暂态及持续信号部分,以避免暂态分散和时常伴随WSOLA及SOLA发生的时域混迭。延展诸如定音管发出的绝对音调信号与诸如响板发出的打击式信号的组合,这一任务提出了挑战。下面将参照一些常规方法以提供本专利技术的背景。一些现行的方法较强地延展暂态周围的时间以在暂态持续时间内不执行时间延展或只执行很小的时间延展(例如参见参考文献至)。以下文章及专利描述了时间和/或音高操纵、、、、、、 、。在中,提出了一种方法,在时间延展版本中大致保留信号的包络及其频谱特性。该方法希望时间扩张打击事件的衰减慢于原始事件。若干广为人知的方法允许有区别地处理暂态及稳态信号分量,例如,将信号建模为正弦波、暂态及噪声的总和(S+T+N) 。为了在时间缩放修改之后保留暂态,分离地延展所有三部分。此技术能够完美地保留音频信号的暂态分量。但是,所产生的声音时常感觉不自然。其他方法改变时间延展的量且在暂态时间期间将其设定成1或在暂态事件下锁定相位。文献给出了利用PV如何在时间及频率延展中保留暂态。在此方法中,在信号被延展之前从该信号中截除(cut out)暂态。暂态部分的移除使信号内产生间隙,所述间隙通过PV过程被延展。在延展之后,暂态被重新加入该信号中,并具有在适合经延展的间隙的周边。鉴于上述内容,需要一种操纵包括暂态事件的音频信号的构思,其提供具有改进的感知质量的输出信号。
技术实现思路
依据本专利技术的实施例建立了用于操纵包括暂态事件的音频信号的装置。该装置包括暂态信号替换器,被配置成以适应于音频信号的一个或多个非暂态信号部分的信号能量特性或适应于暂态信号部分的信号能量特性的替换信号部分,来替换该音频信号的包括暂态事件的暂态信号部分,以获得暂态减少音频信号。该装置进一步包括信号处理器,该处理器被配置成处理暂态减少音频信号来获得暂态减少音频信号的经处理版本。该装置还包括暂态信号重新插入器,被配置成将该暂态减少音频信号的经处理版本与以原始或经处理形式表示暂态信号部分的暂态内容的暂态信号相组合。上述实施例系基于以下研究结果若暂态信号部分由替换信号部分替换,其中替换信号部分的信号能量适应于原始音频信号的信号能量特性,则信号处理器提供具有改进质量的输出信号,同时减少或消除暂态事件。该构思避免了简单地从音频信号中消除暂态信号部分而导致的输入信号处理器的信号的能量的较大阶跃式变化,且还可避免或至少减小暂态对该信号处理器的有害影响。因此,通过移除或减少音频信号中的暂态事件(以获得暂态减少音频信号),且通过限制与输入音频信号相比时该暂态减少音频信号的能量变化,信号处理器接收适当的输入信号,使得其输出信号近似不具有暂态事件的所需输出信号。在较佳实施例中,暂态信号替换器被配置成提供替换信号部分(或暂态减少信号部分),使得与暂态信号部分相比,该替换信号部分表示具有平滑时间演进的时间信号,且使得在该替换信号部分的能量与该暂态信号部分之前或该暂态信号部分之后的音频信号非暂态信号部分的能量之间的偏差小于预定阈值。以此方式,可以实现替换信号部分满足两个条件,即所谓的“暂态条件”及所谓的“能量条件”。暂态条件指示由时域中的阶跃或波峰表示的暂态事件在替换信号部分内的强度(或阶跃高度或波峰高度)上受限制。能量条件进一步指示(该替换信号部分的)暂态减少音频信号应具有能谱分布的平滑时间演进。 通常,能谱分布的时间演进中的不连续性导致可听见的伪像的产生。因此,通过限制能谱分布的这些时间不连续性,可避免可听见的伪像,伪像可能由仅从输入音频信号中删除(而不替换)暂态信号部分而产生。在较佳实施例中,暂态信号替换器被配置成外插暂态信号部分之前的一个或多个信号部分的振幅值,来获得替换信号部分的振幅值。暂态信号替换器还被配置成外插暂态信号部分之前的一个或多个信号部分的相位值,来获得替换信号部分的相位值。使用此方法,可获得暂态减少音频信号的平滑振幅演进。而且,该暂态减少音频信号的不同频本文档来自技高网
...

【技术保护点】
1.一种用于操纵包括暂态事件的音频信号(110)的装置(100),该装置(100)包括:暂态信号替换器(130),被配置成用替换信号部分来替换音频信号的包括暂态事件的暂态信号部分,以获得暂态减少音频信号(132),该替换信号部分适应于音频信号的一个或多个非暂态信号部分的信号能量特性,或适应于暂态信号部分的信号能量特性;信号处理器(140),被配置成处理暂态减少音频信号(132)来获得暂态减少音频信号的经处理(142);以及暂态信号重新插入器(150),被配置成将暂态减少音频信号(132)的经处理版本(142)与以原始或经处理形式表示暂态信号部分的暂态内容的暂态信号(152)相组合。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:弗雷德里克·纳格尔
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1