用于语音提取的系统和方法技术方案

技术编号：8567403 阅读：174 留言：0更新日期：2013-04-12 00:50

在一些实施例中，一种处理器可读介质存储代码，所述代码表示使得处理器接收具有第一分量和第二分量的输入信号的指令。基于所述输入信号的所述第一分量的音高的估计量计算所述输入信号的所述第一分量的估计量。基于所述输入信号的所述第一分量的估计量和所述输入信号的所述第二分量的估计量计算所述输入信号的估计量。基于尺度函数修改所述输入信号的所述第一分量的估计量以产生所述输入信号的经重建的第一分量。所述尺度函数是所述输入信号、所述输入信号的所述第一分量的估计量、所述输入信号的所述第二分量的估计量或从残余信号中的至少一个的函数。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
一些实施例涉及语音提取，并且更特别地涉及语音提取的系统和方法。
技术介绍
已知的语音技术(例如自动语音识别或说话人识别)典型地遇到由包括背景噪声、干扰说话人、信道失真等的外部因素干扰的语音信号。例如，在已知的通信系统(例如移动电话、陆线电话、其它无线技术和网络电话技术)中，正在传输的语音信号通常受到外部噪声和干扰源干扰。类似地，戴着助听器和耳蜗植入装置的用户常常受到外部干扰的折磨，外部干扰干扰他们试图理解的语音信号。这些干扰会变得无法抵挡使得用户常常宁愿关闭他们的医疗装置，因此，这些医疗装置在某些情况下对于一些用户是无用的。所以，需要一种语音提取方法来改善由这些装置(例如医疗装置或通信装置)产生的语音信号的品质。另外，已知的语音提取方法常常试图通过依赖于多个传感器(例如麦克风)执行语音分离的功能(例如从语音分离干扰性语音信号或分离背景噪声)以利用它们的几何间隔改善语音信号的品质。然而先前所述的多数通信系统和医疗装置仅仅包括一个传感器(或某个其它有限数量)。所以，已知的语音提取方法不适合用于未进行昂贵修改的这些系统或装置。因此，需要一种改进的语音提取方法，其可以使用单传感器将期望语音与干扰性语音信号或背景噪声分离并且也可以提供好于多麦克风解决方案的语音品质恢复。
技术实现思路
在一些实施例中，一种处理器可读介质存储代码，所述代码表示导致处理器接收具有第一分量和第二分量的输入信号的指令。基于所述输入信号的所述第一分量的音高的估计量计算所述输入信号的所述第一分量的估计量。基于所述输入信号的所述第一分量的估计量和所述输入信号的所述第二分量的估计量计算所述输入信号的估...
<a href="http://www.xjishu.com/zhuanli/21/201180013528.html" title="用于语音提取的系统和方法原文来自X技术">用于语音提取的系统和方法</a>

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2010.01.29 US 61/299,7761.一种存储代码的处理器可读介质，所述代码表示使得处理器执行方法的指令，所述代码包括用于以下操作的代码接收具有第一分量和第二分量的输入信号；基于所述输入信号的所述第一分量的音高的估计量计算所述输入信号的所述第一分量的估计量；基于所述输入信号的所述第一分量的估计量和所述输入信号的所述第二分量的估计量计算所述输入信号的估计量；以及基于尺度函数修改所述输入信号的所述第一分量的估计量以产生所述输入信号的经重建的第一分量，所述尺度函数是所述输入信号、所述输入信号的所述第一分量的估计量、所述输入信号的所述第二分量的估计量或从所述输入信号和所述输入信号的估计量导出的残余信号中的至少一个的函数。2.根据权利要求1所述的处理器可读介质，还包括用于以下操作的代码基于所述输入信号的所述第二分量的音高的估计量计算所述输入信号的所述第二分量的估计量。3.根据权利要求1所述的处理器可读介质，其中所述尺度函数是第一尺度函数，所述处理器可读介质还包括用于以下操作的代码基于第二尺度函数修改所述输入信号的所述第二分量的估计量以产生所述输入信号的经重建的第二分量，所述第二尺度函数不同于所述第一尺度函数并且是所述输入信号、所述输入信号的所述第一分量的估计量、所述输入信号的所述第二分量的估计量或所述残余信号中的至少一个的函数。4.根据权利要求1所述的处理器可读介质，还包括用于以下操作的代码基于所述输入信号的所述经重建的第一分量的至少一个特性将源分配给所述输入信号的所述第一分量。5.根据权利要求1所述的处理器可读介质，还包括用于以下操作的代码以指定帧率采样所述输入信号持续多个帧，来自所述多个帧的每个帧与多个频道关联，计算所述输入信号的所述第一分量的估计量的代码包括在来自所述多个帧的每个帧的所述多个频道的每个频道计算所述输入信号的所述第一分量的估计量，用于修改的代码包括用于基于尺度函数在来自所述多个帧的每个帧的所述多个频道的每个频道修改所述输入信号的所述第一分量的每个估计量的代码，所述尺度函数基于来自所述多个频道的频道自适应，在所述输入信号的所述第一分量的每个经修改的估计量跨越来自所述多个帧的每个帧的所述多个频道的每个频道组合之后产生所述输入信号的所述经重建的第一分量。6.根据权利要求1所述的处理器可读介质，其中所述尺度函数被配置成用作非线性函数、线性函数或基于阈值的开关中的一个。7.根据权利要求1所述的处理器可读介质，其中所述残余信号对应于从所述输入信号减去所述输入信号的估计量。8.根据权利要求1所述的处理器可读介质，其中所述第一分量与第一源关联，所述第二分量与不同于所述第一源的第二源关联。9.根据权利要求1所述的处理器可读介质，其中所述处理器是用户的装置的数字信号处理器，所述代码被下载到所述处理器可读介质。10.根据权利要求1所述的处理器可读介质，其中所述尺度函数是所述输入信号的所述第一分量的乘方、所述输入信号的所述第二分量的乘方、所述输入信号的乘方和所述残余信号的乘方的函数。11.根据权利要求1所述的处理器可读介质，其中所述尺度函数基于所述输入信号的所述第一分量的音高的估计量自适应所述输入信号的所述第一分量的...

【专利技术属性】
技术研发人员：C·埃斯佩威尔松，S·威什诺博霍特拉，
申请(专利权)人：马里兰大学派克分院，
类型：
国别省市：

全部详细技术资料下载我是这个专利的主人