【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总体涉及处理声信号,并且更具体地,涉及从诸如语音信号的声信号中去除加性噪声。
技术介绍
从诸如语音信号的声信号中去除加性噪声在电话、音频语音录制和电子语音通信中具有许多应用。噪声在城市环境、工厂、飞机、车辆等中普遍存在。去除更精确地反映环境中的真实噪声的时变噪声特别困难。通常,使用静态噪声模型的抑制技术不能实现非静态噪声消除。诸如谱减法和维纳滤波的常规方法通常使用静态或慢变噪声估计,因此局限于稳态噪声或准稳态噪声。语音包括谐音和非谐音。谐音能够在时间上而具有不同的基频。语音能够在大的频率范围上具有能量。非静态噪声的频谱可以和语音类似。因此,在一个“源”是语音并且另一个“源”是加性噪声的语音去噪应用中,语音与噪声模型之间的交叠使去噪性能下降。单独地依赖给语音和噪声建模的基于模型的语音增强方法在许多不同的问题环境方面已经显示出强大性能。当噪声的结构是任意的时(实践中通常是这种情况),基于模型的方法必须集中于开发良好的语音模型,语音模型的质量是其性能的关键。在建模策略方面,存在两种普遍的方法。一种方法是基于诸如高斯混合模型的离散状态建模的方法。另一种方法使用诸如非负矩阵分解和它们的延伸集的基函数的连续加权组合。一般的权衡是离散状态方法可以更精确,特别是在它们的时间动态方面,而连续方法在增益和子空间可变性方面可以更灵活。例如,U.S.8,015,033描述了使用包括训练声信号和训练噪声信号的训练基础矩< ...
【技术保护点】
一种用于增强输入的有噪信号的方法,其中,所述输入的有噪信号是清晰语音信号与噪声信号的混合,所述方法包括:使用所述清晰语音信号的模型和所述噪声信号的模型,根据所述输入的有噪信号确定多个序列的隐变量,所述多个序列的隐变量包括表示所述清晰语音信号的激励分量的至少一个序列的隐变量、表示所述清晰语音信号的滤波器分量的至少一个序列的隐变量以及表示所述噪声信号的至少一个序列的隐变量,其中,所述清晰语音信号的模型包括非负源‑滤波器动力学系统(NSFDS),该NSFDS将表示所述激励分量的隐变量约束为在时间上统计地具有依存性,并且将表示所述滤波器分量的隐变量约束为在时间上统计地具有依存性,并且其中,所述多个序列的隐变量包括被确定为非负基函数的非负线性组合的隐变量;以及使用表示所述激励分量和所述滤波器分量的相应隐变量的乘积来生成输出信号,其中,所述方法的步骤由处理器执行。
【技术特征摘要】
【国外来华专利技术】2013.10.22 US 61/894,180;2014.03.26 US 14/225,8701.一种用于增强输入的有噪信号的方法,其中,所述输入的有噪信号是清晰语音信号
与噪声信号的混合,所述方法包括:
使用所述清晰语音信号的模型和所述噪声信号的模型,根据所述输入的有噪信号确定
多个序列的隐变量,所述多个序列的隐变量包括表示所述清晰语音信号的激励分量的至少
一个序列的隐变量、表示所述清晰语音信号的滤波器分量的至少一个序列的隐变量以及表
示所述噪声信号的至少一个序列的隐变量,其中,所述清晰语音信号的模型包括非负源-滤
波器动力学系统(NSFDS),该NSFDS将表示所述激励分量的隐变量约束为在时间上统计地具
有依存性,并且将表示所述滤波器分量的隐变量约束为在时间上统计地具有依存性,并且
其中,所述多个序列的隐变量包括被确定为非负基函数的非负线性组合的隐变量;以及
使用表示所述激励分量和所述滤波器分量的相应隐变量的乘积来生成输出信号,其
中,所述方法的步骤由处理器执行。
2.根据权利要求1所述的方法,其中,所述激励分量的隐变量或所述滤波器分量的隐变
量包括形成离散状态马尔可夫链的状态变量。
3.根据权利要求1所述的方法,其中,所述激励分量的隐变量或所述滤波器分量的隐变
量包括形成连续状态马尔可夫链的状态变量。
4.根据权利要求1所述的方法,其中,所述多个序列的隐变量包括表示增益分量的至少
一个序列,并且其中,所述输出信号被生成为表示所述激励分量和所述滤波器分量以及所
述增益分量的相应隐变量的乘积。
5.根据权利要求4所述的方法,其中,所述增益分量的序列形成马尔可夫链。
6.根据权利要求4所述的方法,其中,所述增益分量的序列形成伽玛马尔可夫链。
7.根据权利要求1所述的方法,其中,所述确定使用最大...
【专利技术属性】
技术研发人员:J·勒鲁克斯,J·R·赫尔歇,U·斯木塞克里,
申请(专利权)人:三菱电机株式会社,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。