用于增强输入的有噪信号的方法和系统技术方案

技术编号:14991106 阅读:129 留言:0更新日期:2017-04-03 22:16
一种从输入的有噪信号确定多个序列的隐变量的方法,多个序列的隐变量包括表示清晰语音信号的激励分量的至少一个序列的隐变量、表示清晰语音信号的滤波器分量的至少一个序列的隐变量和表示噪声信号的至少一个序列的隐变量。所述多个序列的隐变量包括被确定为非负基函数的非负线性组合的隐变量。所述确定使用清晰语音信号的模型,该模型包括将激励分量和滤波器分量的隐变量约束为在时间上统计地具有依存性的非负源-滤波器动力学系统(NSFDS)。所述方法使用表示激励分量和滤波器分量的相应隐变量的乘积生成输出信号。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总体涉及处理声信号,并且更具体地,涉及从诸如语音信号的声信号中去除加性噪声。
技术介绍
从诸如语音信号的声信号中去除加性噪声在电话、音频语音录制和电子语音通信中具有许多应用。噪声在城市环境、工厂、飞机、车辆等中普遍存在。去除更精确地反映环境中的真实噪声的时变噪声特别困难。通常,使用静态噪声模型的抑制技术不能实现非静态噪声消除。诸如谱减法和维纳滤波的常规方法通常使用静态或慢变噪声估计,因此局限于稳态噪声或准稳态噪声。语音包括谐音和非谐音。谐音能够在时间上而具有不同的基频。语音能够在大的频率范围上具有能量。非静态噪声的频谱可以和语音类似。因此,在一个“源”是语音并且另一个“源”是加性噪声的语音去噪应用中,语音与噪声模型之间的交叠使去噪性能下降。单独地依赖给语音和噪声建模的基于模型的语音增强方法在许多不同的问题环境方面已经显示出强大性能。当噪声的结构是任意的时(实践中通常是这种情况),基于模型的方法必须集中于开发良好的语音模型,语音模型的质量是其性能的关键。在建模策略方面,存在两种普遍的方法。一种方法是基于诸如高斯混合模型的离散状态建模的方法。另一种方法使用诸如非负矩阵分解和它们的延伸集的基函数的连续加权组合。一般的权衡是离散状态方法可以更精确,特别是在它们的时间动态方面,而连续方法在增益和子空间可变性方面可以更灵活。例如,U.S.8,015,033描述了使用包括训练声信号和训练噪声信号的训练基础矩<br>阵以及训练基础矩阵的权重的统计的模型将例如语音和噪声信号的混合信号去噪。但是,一般来说,集中于慢变噪声的常规方法不足以快速改变诸如在嘈杂的环境中通过使用麦克风而经受的非静态噪声。另外,补偿快速改变的加性噪声需要达到方法可以补偿所有可能的大量噪声的程度的高计算能力,并且语音变化可以快速地变成计算方面成本过高的。因此,期望提供一种动态且自适应的语音增强方法。
技术实现思路
本专利技术的一些实施方式使用概率模型来增强带噪声的语音信号。一些实施方式的一个目的是通过考虑基础的语音产生过程及其动态来对语音精确地建模。根据本专利技术的各实施方式,概率模型是非负源-滤波器动力学系统(NSFDS:non-negativesource-filterdynamicalsystem),该系统将激励部分和滤波部分建模为非负动力系统。例如,模型的状态可以被分解成针对滤波器的离散分量(即,音素)、状态和能够将语音增强方法的训练部分和去噪部分简化的激励状态。另外,NSFDS将对应的激励状态和滤波器分量约束为在经过形成马尔可夫链的时间上统计地具有依存性。这些约束能够代表语音的动力学,引起阶乘HMM和非负动力学系统方法之间的混合。另外,在一些实施方式中,NSFDS将激励和滤波器分量建模为非负动力学系统,使得代表激励和滤波器分量的隐变量被确定为非负基函数的非负线性组合。例如,使用非负基函数的非负线性组合对功率谱建模解决了适应于被建模信号中的增益和其它变量的问题。不同的实施方式已经单独地添加了例如在时间上统计地具有依存性的形式的动力学约束或激励-滤波器因子分解约束或它们的组合。总的来说,动力学约束处理由于推断的信号中随着时间的不现实转变而导致的不精确,并且激励-滤波器约束处理了因为没有充分的训练数据造成的不精确,这是因为训练数据单独地代表激励和滤波器特性,而不是对所有组合进行建模。使用动力学约束和激励-滤波器约束的组合来扩展利用非负基函数的非负线性组合对功率谱建模能够一起带来增加动力学约束和激励-滤波器约束并同时保持语音增强的计算成本适合于实时应用的的优点。另外,因为通过单独地发展在说话人的口中和喉咙中的物理过程来管理语音的激励特性和滤波特性,所以针对激励分量和滤波分量使用单独的动力学带来了更精确和更高效地建模的额外好处。因此,一个实施方式公开了一种用于增强输入的有噪信号的方法,其中,所述输入的有噪信号是清晰语音信号和噪声信号的混合。所述方法包括以下步骤:使用所述清晰语音信号的模型和所述噪声信号的模型,从所述输入的有噪信号确定多个序列的隐变量,所述多个序列的隐变量包括表示所述清晰语音信号的激励分量的至少一个序列的隐变量、表示所述清晰语音信号的滤波器分量的至少一个序列的隐变量以及表示所述噪声信号的至少一个序列的隐变量,其中,所述清晰语音信号的模型包括非负源-滤波器动力学系统(NSFDS),该NSFDS将表示所述激励分量的隐变量约束为在时间上统计地具有依存性,并且将表示所述滤波器分量的隐变量约束为在时间上统计地具有依存性,并且其中,所述隐变量的序列包括被确定为非负基函数的非负线性组合的隐变量;以及使用相对应的表示所述激励分量的隐变量与表示所述滤波器分量的隐变量的乘积来生成输出信号。所述方法的步骤由处理器执行。另一个实施方式公开了一种用于增强输入的有噪信号的系统,其中,所述输入的有噪信号是清晰语音信号与噪声信号的混合。所述系统包括:存储器,其用于存储所述清晰语音信号的模型,其中,所述清晰语音信号的模型包括非负源-滤波器动力学系统(NSFDS);以及处理器,其用于使用所述NSFDS从所述输入的有噪信号确定多个序列的隐变量,所述多个序列的隐变量包括表示所述清晰语音信号的激励分量的至少一个序列的隐变量、表示所述清晰语音信号的滤波器分量的至少一个序列的隐变量,其中,所述NSFDS将表示所述激励分量的隐变量和表示所述滤波分量的隐变量约束为在时间上统计地具有依存性,并且其中,所述隐变量的序列包括被确定为非负基函数的非负线性组合的隐变量,并且所述处理器用于使用表示所述激励分量和所述滤波分量的相对隐变量的乘积生成输出信号。附图说明[图1A]图1A是根据本专利技术的一些实施方式的用于对语音信号和噪声的混合去噪的方法的总体框图。[图1B]图1B是根据本专利技术的一些实施方式的用于对混有噪声的语音去噪的系统的示例。[图1C]图1C是根据本专利技术的一些实施方式的包括图1B的系统的仪表盘的示意性示例。[图2]图2是根据本专利技术的一些实施方式的非负源-滤波器动力学系统(NSFDS)的示意图。[图3A]图3A例示了根据本专利技术的一些实施方式的NSFDS的分量的实验数值。[图3B]图3B是根据本专利技术的一些实施方式的语音的NSFDS模型的图表。[图4]图4是根据本专利技术的一个实施方式的用于增强有噪语音信号的方法的框图。[图5]图5是采用一些实施方式的原理的示例方法的框图。[图6]图6是示出针对清晰语音的变量本文档来自技高网
...

【技术保护点】
一种用于增强输入的有噪信号的方法,其中,所述输入的有噪信号是清晰语音信号与噪声信号的混合,所述方法包括:使用所述清晰语音信号的模型和所述噪声信号的模型,根据所述输入的有噪信号确定多个序列的隐变量,所述多个序列的隐变量包括表示所述清晰语音信号的激励分量的至少一个序列的隐变量、表示所述清晰语音信号的滤波器分量的至少一个序列的隐变量以及表示所述噪声信号的至少一个序列的隐变量,其中,所述清晰语音信号的模型包括非负源‑滤波器动力学系统(NSFDS),该NSFDS将表示所述激励分量的隐变量约束为在时间上统计地具有依存性,并且将表示所述滤波器分量的隐变量约束为在时间上统计地具有依存性,并且其中,所述多个序列的隐变量包括被确定为非负基函数的非负线性组合的隐变量;以及使用表示所述激励分量和所述滤波器分量的相应隐变量的乘积来生成输出信号,其中,所述方法的步骤由处理器执行。

【技术特征摘要】
【国外来华专利技术】2013.10.22 US 61/894,180;2014.03.26 US 14/225,8701.一种用于增强输入的有噪信号的方法,其中,所述输入的有噪信号是清晰语音信号
与噪声信号的混合,所述方法包括:
使用所述清晰语音信号的模型和所述噪声信号的模型,根据所述输入的有噪信号确定
多个序列的隐变量,所述多个序列的隐变量包括表示所述清晰语音信号的激励分量的至少
一个序列的隐变量、表示所述清晰语音信号的滤波器分量的至少一个序列的隐变量以及表
示所述噪声信号的至少一个序列的隐变量,其中,所述清晰语音信号的模型包括非负源-滤
波器动力学系统(NSFDS),该NSFDS将表示所述激励分量的隐变量约束为在时间上统计地具
有依存性,并且将表示所述滤波器分量的隐变量约束为在时间上统计地具有依存性,并且
其中,所述多个序列的隐变量包括被确定为非负基函数的非负线性组合的隐变量;以及
使用表示所述激励分量和所述滤波器分量的相应隐变量的乘积来生成输出信号,其
中,所述方法的步骤由处理器执行。
2.根据权利要求1所述的方法,其中,所述激励分量的隐变量或所述滤波器分量的隐变
量包括形成离散状态马尔可夫链的状态变量。
3.根据权利要求1所述的方法,其中,所述激励分量的隐变量或所述滤波器分量的隐变
量包括形成连续状态马尔可夫链的状态变量。
4.根据权利要求1所述的方法,其中,所述多个序列的隐变量包括表示增益分量的至少
一个序列,并且其中,所述输出信号被生成为表示所述激励分量和所述滤波器分量以及所
述增益分量的相应隐变量的乘积。
5.根据权利要求4所述的方法,其中,所述增益分量的序列形成马尔可夫链。
6.根据权利要求4所述的方法,其中,所述增益分量的序列形成伽玛马尔可夫链。
7.根据权利要求1所述的方法,其中,所述确定使用最大...

【专利技术属性】
技术研发人员:J·勒鲁克斯J·R·赫尔歇U·斯木塞克里
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1