用于减少音频处理算法中的非自然信号的方法和装置制造方法及图纸

技术编号:7486923 阅读:199 留言:0更新日期:2012-07-09 21:20
本发明专利技术公开了用于减少音频处理算法中的非自然信号的方法和装置。该方法包括:提供多个相邻时帧中的输入信号的时频表示i(k,m),每一时帧包括多个时频单元,每一时频单元包括输入信号的复值或实值,k、m分别为频率和时间指数;将音频处理算法应用于输入信号的时频表示并提供估计的算法输出信号;对输入信号的至少一频率,确定给定时帧的时频单元的估计的算法输出信号的值和在前时帧的该值之间的差;确定所述差的量值的度量;提供量值差的度量的时间平均值;基于量值差的度量的时间平均值提供置信估计量,随着量值差的度量的时间平均值递增,置信估计量从最大值朝向最小值递减。本发明专利技术的目的在于改善用户对经受一个或多个音频处理算法的声信号的感知。本发明专利技术可用于音频处理系统如广播系统或听音装置如听力仪器。

【技术实现步骤摘要】

本申请涉及音频处理,例如涉及降噪算法。本专利技术尤其涉及减少用于将随时间和频率而变的增益应用于输入音频信号的音频处理算法中的非自然信号的方法。另外,本申请涉及用于将随时间而变的增益应用于输入音频信号的音频处理装置及涉及音频处理装置的用途。本申请还涉及包括处理器和程序代码的数据处理系统,程序代码使处理器执行本专利技术方法的至少部分步骤。本申请还涉及保存前述程序代码的计算机可读介质。本专利技术可用在音频处理系统如广播系统、听音装置如听力仪器等应用中。
技术介绍
跨时间和频率快速波动的增益导致数字音频处理系统中出现听得见的非自然信号。US 6,351,731描述了一种自适应滤波器,其特征在于语音谱估计器将针对输入信号时帧估计的谱量值信号接收为输入并产生表示时帧中的语音的估计的谱量值的估计的语音谱量值信号。谱增益调节器将初始谱增益信号接收为输入并通过限制初始谱增益信号在多个先前的时帧内相对于谱增益的变化率而产生调节后的增益信号。之后,调节后的增益信号应用于谱信号,然后转换为其时域当量。US 6,088,668描述了一种噪声抑制器,其包括信噪比(SNR)确定器、通道增益确定器、增益平滑器和乘法器。SNR确定器确定输入信号每通道的SNR。通道增益确定器确定每第i通道的通道增益。增益平滑器产生每第i通道的平滑增益,及乘法器使输入信号的每一通道与其相关联的平滑增益相乘。US 7,016,507描述了一种降噪算法,其具有两个目的,即相对于噪声增强语音及为压缩电路提供相对干净的信号。在实施例中,引入遗忘因子以减慢衰减函数中的急剧增益变化。
技术实现思路
由音频处理算法如降噪算法产生的非自然信号的量可通过检测波动的增益并在这些情形下有选择地减小增益而得以明显减小。在本说明书中,术语增益广义地理解为包括衰减,S卩非对数标度上的增益因数大于或等于0,及高于和低于1 (衰减),或按dB计的增益因数包括正、零及负值(衰减)。图1示出了可怎样实施这样的检测装置。在每一子频带中,增益差定义为当前增益和先前增益之间的差。之后,该差随着时间的过去进行平滑。平滑例如可实施为HR滤波器或IIR滤波器,例如具有不同的上升时间和释放时间(HR=有限脉冲响应,IIR=无限脉冲响应)。之后,平滑后的增益值转换为0和1之间的数,其随后乘以按dB计的增益。 这样的转换的例子在图2中示出。本专利技术的目标在于提高用户对已经历一个或多个音频处理算法的声信号的感知。本专利技术的目标由所附权利要求及下面的描述中限定的专利技术实现。石角育P匕自言胃白々力fe本申请的目标由减少用于将随时间和频率而变的增益应用于输入信号的音频处理算法中的非自然信号的方法实现。该方法包括-提供多个相邻时帧中的输入信号的时频表示i(k,m),每一时帧包括多个时频单元,每一时频单元包括输入信号的复值或实值,k、m分别为频率和时间指数;-将音频处理算法应用于输入信号的时频表示并提供估计的算法输出信号;-对输入信号的至少一频率,确定给定时帧的时频单元的估计的算法输出信号的值和在前时帧的该值之间的差;-确定所述差的量值的度量;-提供量值差的度量的时间平均值;-基于量值差的度量的时间平均值提供置信估计量,随着量值差的度量的时间平均值递增,置信估计量从最大值朝向最小值递减。本专利技术的优点在于提供确定及可能减少用于处理时频表示的音频信号的算法中的非自然信号的工具。在音频处理的上下文中,术语“非自然信号”意为因信号处理(数字化、降噪、压缩等)引起的、在呈现给听者时通常不被感知为自然声音的音频信号部分。非自然信号通常称为音乐噪声,其由所得信号中的随机谱峰值引起。这样的非自然信号听上去像短纯音。 音乐噪声例如在、和中描述。在本说明书中,术语“估计的算法输出信号”意为没有本专利技术中提出的非自然信号减少措施时音频处理算法的输出。术语“改善的算法输出信号”意为已经历本专利技术中提出的非自然信号减少措施时音频处理算法的输出。相较“估计的算法输出信号”,“改善的算法输出信号”包含更少的非自然信号。优选地,估计的算法输出信号在与输入信号一样的频率单元中进行估计(即估计的算法输出信号的值在与输入信号一样的频率单元Af1,Af2,..., AfK(或至少其部分) 中提供,例如参见图3)。总的来说,音频处理算法可以是导致相当快速变化的增益或衰减的任何类型的算法,例如降噪算法、语音增强算法(例如参见等)。音频处理算法可适于对源自单一或源自多个输入变换器的输入信号起作用。在实施例中,本专利技术方法包括步骤将置信估计量应用于估计的算法输出信号从而提供改善的算法输出信号ο (k,m)。作为备选或另外,置信估计量用作另一算法或检测器如用于估计回响的算法的输入。输入信号可以是模拟或数字时变信号。输入信号可由按绝对(如伏特或安培)或相对(如dB)项测量的(时变)信号值表示。输入信号可以是相对增益(如按dB测量) 或归一化增益(或衰减),得到0和1之间的值(其可在后来转换为相对增益(或衰减), 例如按dB测量),例如平方归一化增益(或升到不同于2的任何其它幂的归一化增益)。在实施例中,给定时帧的时频单元的估计的算法输出信号的值与在前时帧的该值之间的差针对至少两个频率或频带进行确定,例如针对大部分频率或频带,如针对输入信号的所有频率或频带(因而确定估计的算法输出信号)。在实施例中,估计的算法输出信号的每一频带的进行比较的值(如信号值或增益或衰减值)按实际值(如声压或电压或电流)、或归一化值(如0和1之间)、或相对值(如按dB)提供。在实施例中,估计的算法输出信号的每一频率或频带的进行比较的值按归一化值提供,例如位于0和1之间。在实施例中,归一化增益或衰减转换为按dB测量的增益或衰减。在实施例中,给定时帧的时频单元的估计的算法输出信号的值与在前时帧的该值之间的差或平均差提供为如转换为0和1之间的数。总的来说,如果置信估计量高,则音频处理算法的效果保持不变。优选地,如果置信估计量低,则音频处理算法的效果减小(例如消除)。在实施例中,改善的算法输出信号o(k,m)表达为置信估计量ce(k,m)乘以估计的算法输出信号eao(k,m),即o(k,m) = ce (k,m) *eao (k,m)。在实施例中,置信估计量ce (k, m)大于或等于0,如在0到1的范围中。在实施例中,如果置信估计量ce(k,m)达到其最大值,则估计的算法输出信号 eao (k,m)保持不变。换言之,改善的算法输出信号ο (k,m) = eao(k,m) (ce(k,m) = 1)。在实施例中,如果置信估计量达到其最小值,则估计的算法输出信号eao(k,m)减小(如果其为增益或衰减,则从初始值朝向OdB减小)。换言之,改善的算法输出信号ο (k,m) =ce(k, m)*eao(k,m),其中 ce(k, m) < 1,例如=0。在实施例中,仅考虑估计的算法输出信号的量值。在实施例中,估计的算法输出信号的量值差的度量被发现为差的绝对值。在实施例中,估计的算法输出信号的量值差的度量被发现为差的平方绝对值。在该情形下,置信估计量对应于估计的算法输出信号的方差。在实施例中,(给定时帧的时频单元的估计的算法输出信号的值与在前时帧的该值之间的)量值差的度量在预定时间段求平均。在实施例中,预定时间段与用于本文档来自技高网...

【技术保护点】

【技术特征摘要】
...

【专利技术属性】
技术研发人员:M·S·彼德森
申请(专利权)人:奥迪康有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术