用于估计目标和噪声谱方差的多传声器方法技术

技术编号:12021525 阅读:316 留言:0更新日期:2015-09-09 18:40
本发明专利技术公开了用于估计目标和噪声谱方差的多传声器方法,该方法包括:a)提供或接收多个频带和多个时刻时第i个输入单元处的有噪声音频信号yi(n)的时频表示Yi(k,m),i=1,2,…,M,其中M大于或等于2,k为频带指数,及m为时间指数;b)提供目标信号分量和第一噪声信号分量的特性;及c)将第一噪声信号分量v和目标信号分量x的谱方差或其换算版λV,λX分别估计为频率指数k和时间指数m的函数,λV和λX的估计量在最大似然方面共同最佳,基于下述统计假设:a)相应信号yi(n)、及信号分量xi(n)和vi(n)的时频表示Yi(k,m),Xi(k,m)和Vi(k,m)均为零均值、复值高斯分布;b)它们中的每一个跨时间m和频率k统计上独立;及c)Xi(k,m)和Vi(k,m)不相关。

【技术实现步骤摘要】

本申请设及用于估计有噪声(如混响)信号中的相应目标和噪声(如混响)信号 分量的谱方差的音频处理方法和音频处理系统,及该音频处理系统的用途。本申请还设及 包括处理器和程序代码的数据处理系统,程序代码使得处理器执行本专利技术方法的至少部分 步骤。 例如,本专利技术的实施可用在助听装置如助听器、头戴式耳机、耳麦、有源耳朵保护 系统、免提电话系统、移动电话等应用中或者用在远程会议系统、广播系统、卡拉0K系统、 教室放大系统等系统中。
技术介绍
下面的现有技术说明设及本申请的应用领域之一,即助听器。 已知助听器用户在混响环境如具有硬壁的房间、教堂、讲演厅等中面临理解语音 的问题。尽管该用户问题众所周知,但似乎只有为数不多的与该问题有关的助听器信号处 理算法。US2009248403A公开了多传声器系统及消除混响的线性预测模型。W012159217A1 设及在混响环境中或在除直接声音之外还具有扩散声音的其它环境中提高语音可懂度的 技术。US2013343571A1公开了传声器阵列处理系统,其包括配置成减少波束形成剩下的噪 声分量(如混响)的自适应波束形成和后滤波。US2010246844A1设及确定信号分量W减 少输入信号中的噪声(如混响)的方法。设及有噪声环境中的去混 响。设及功率谱域中通过对称传声器阵列的各向同性噪声抑制。 所描述的方法基于自由场假设确定目标信号的谱方差,其中协方差矩阵圆形对称。
技术实现思路
撞击在传声器上的混响和有噪声语音信号可分为两个(非必须地,=个)部分:a)语音信号的直接声音和前几次反射(包括直接声音之后的约50ms脉冲响应);[000引 b)后混响信号,即比直接声音晚约50ms到达的反射语音信号分量;及非必须地C)附加噪声分量。 假定附加噪声的信号功率(具体地,输入变换器间协方差矩阵,参见后述)已知。 在本专利技术中,附加噪声的例子为传声器噪声、发动机噪声(如在汽车或飞机中)、大的喧哗 噪声(如所谓的"鸡尾酒会噪声")。 众所周知,大约说来,部分a)有益于语音可懂度,而部分b)和C)对正常听力和听 力受损听者而言均降低可懂度。 本专利技术的主要目标在于使用两个W上传声器将信号功率在线估计为每一信号分 量a)和b)的时间和频率的函数(即动态地,在使用音频处理装置如助听装置期间)。所提 出的方法与传声器位置和数量无关,也就是说,其可在助听器本地有两个传声器可用的情 形下起作用,也可在外部传声器信号如来自对侧助听器或外部装置的传声器信号可用的情 形下起作用。 如下面更详细归纳地,该主要想法具有几个潜在的用途:i)用于在助听器中选择适当的处理方法;ii)用于通知用户助听器在特定环境中能够何种程度地适当运行;iii)用于处理信号W减少混响及可选地减少附加噪声,等等。 本专利技术基于典型目标语音信号和混响声场的空间特性十分不同的事实。具体地, 所提出的方法利用混响声场可建模为适当各向同性,即对于特定频率,源自任何方向的混 响信号功率(大约)一样。另一方面,目标语音信号的直接部分大致上局限于一个方向。 在本专利技术的实施例中,提出了用于语音去混响的算法,其使能也在语音存在 期间联合估计目标和干扰谱方差。该算法使用最大似然估计(ML巧方法,例如参见 。我们假定混响的各向同性空间分布及已知讲话者方向。因此,语音和 混响的传声器间协方差矩阵的结构已知,在MLE框架中仅估计时变谱方差(该些矩阵的换 算因子)。 应注意,本专利技术中提出的算法也可适用于不同于语音的目标信号及不同于混响的 干扰类型。然而,前提条件是干扰的空间分布各向同性,或者已知或已估计该空间分布。 本专利技术的目标在于提供用于将信号功率估计为混响语音信号的混响部分的时间 和频率的函数的方法。本专利技术的另外的目标在于(相较于现有解决方案)提高有噪声情形 下的语音可懂度。本专利技术的目标还在于提高有噪声情形下的声音质量。 本申请的目标由所附权利要求限定的及下面描述的专利技术实现。 化理有啜声音频信号的方法 在本申请的一方面,本申请的目标由包括目标信号分量x(n)和第一噪声信号分 量v(n)的有噪声音频信号y(n)的处理方法实现,n表示时间,该方法包括:a)提供或接收多个频带和多个时刻时第i个输入单元处的有噪声音频信号(n) 的时频表示Yi也m),i= 1,2,…,M,其中M大于或等于2,k为频带指数,及m为时间指数; b)提供目标信号分量和第一噪声信号分量的特性;及C)将第一噪声信号分量V和目标信号分量X的谱方差或其换算版AV,Ax分别估 计为频率指数k和时间指数m的函数,Av和AX的估计量在最大似然方面共同最佳,基于 下述统计假设;a)相应信号yi(n)、及信号分量Xi(n)和Vi(n)的时频表示Yi化,m),Xi化,m) 和Vi也m)均为零均值、复值高斯分布;b)它们中的每一个跨时间m和频率k统计上独立; 及c)Xi(k,m)和Vi(k,m)不相关。 本专利技术的优点在于其为提高输入语音信号的可懂度提供基础。本专利技术的另一优点 在于有噪声音频信号的信号分量的谱方差的所得估计与输入单元的数量和/或位置无关。 总的来说,"噪声信号分量的特性"(称为"第一"、"第二"或其它)意为噪声信号 分量关于空间、频率和/或时间的特性(如与信号能量随时间、频率和空间的变化有关)。 该些特性总体上例如可与在不同空间位置(如在输入单元如传声器处)测得的噪声功率谱 密度及其跨时间的变化有关。另外或作为备选,其与噪声能量的方向或空间分布有关,即与 作为方向的函数撞击在输入单元上的噪声能量的量有关(对于特定频率和时刻)。在重要 实施例中,该方法设及附加噪声的"空间特性"。在实施例中,"噪声信号分量的特性"意为 "空间特性"或"空间指纹"。在实施例中,噪声信号分量的"空间特性"或"空间指纹"通过 输入单元间(如传声器间)噪声协方差矩阵定义。 在优选实施例中,本专利技术方法基于空间滤波。在实施例中,目标信号分量和第一噪 声信号分量的特性为空间特性。 术语"其换算版"意为"乘W实数"(不同于零)。 在实施例中,噪声信号分量通过(如空间)特性的假设定义。换言之,有噪声音频 信号的满足所述假设的分量被视为包括在噪声中(如构成噪声)。通常假定输入单元i处 的目标信号分量Xi(n)和噪声信号分量(如Vi(n))不相关。 (可能归一化的)谱方差(或其换算版)AV,Ax通过基于统计模型的最大似然方 法确定。在实施例中,最大似然方法的用于分别确定第一噪声信号分量V和目标信号分量 X的谱方差Av,Ax的统计模型在于相应信号yi(n)和信号分量Xi(n)及Vi(n)的时频表示 Yi也m),Xi也m)和Vi也m)均为零均值、复值高斯分布,它们中的每一个跨时间m和频率k 统计上独立,及Xi化,m)和Vi化,m)不相关。在实施例中,AV和AX的最大似然估计排他地 基于所提及的假设。 在本说明书中,术语"共同最佳"意于强调谱方差Av,Ax中的二者均在同一最大 似然估计过程中进行估计。 该方法总体上基于噪声信号分量的特性的假设。在实施例中,该方法还基于目标 信号分量的特性的假设。在实施例中,目标信号分量的特性包括输入单元相较于目标信号 方向的特定空间安排。在实施例中,目标信号分量的特性包括其时间变化(如其调制)、其 频率本文档来自技高网...

【技术保护点】
包括目标信号分量x(n)和第一噪声信号分量v(n)的有噪声音频信号y(n)的处理方法,n表示时间,所述方法包括:a)提供或接收多个频带和多个时刻时第i个输入单元处的有噪声音频信号yi(n)的时频表示Yi(k,m),i=1,2,…,M,其中M大于或等于2,k为频带指数,及m为时间指数;b)提供目标信号分量和第一噪声信号分量的特性;及c)将第一噪声信号分量v和目标信号分量x的谱方差或其换算版λV,λX分别估计为频率指数k和时间指数m的函数,λV和λX的估计量在最大似然方面共同最佳,基于下述统计假设:a)相应信号yi(n)、及信号分量xi(n)和vi(n)的时频表示Yi(k,m),Xi(k,m)和Vi(k,m)均为零均值、复值高斯分布;b)它们中的每一个跨时间m和频率k统计上独立;及c)Xi(k,m)和Vi(k,m)不相关。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:J·延森A·库拉辛斯基
申请(专利权)人:奥迪康有限公司
类型:发明
国别省市:丹麦;DK

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1