用于变换输入信号的方法技术

技术编号:11637242 阅读:102 留言:0更新日期:2015-06-24 11:44
形式为特征向量的序列的输入信号通过首先将所述输入信号的模型的参数存储到存储器中被变换为输出信号。使用所述向量和所述参数,推断隐变量的向量的序列。对于每个特征向量xn,存在隐变量hi,n的至少一个向量hn,并且每个隐变量非负。使用所述特征向量、隐变量的所述向量和所述参数来生成所述输出信号。每个特征向量xn依赖于相同n的所述隐变量hi,n中的至少一个。所述隐变量根据公式相关,其中j和l是求和索引。所述参数包括非负权重ci,j,l,并且εl,n是独立的非负随机变量。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总体上涉及信号处理,并且更具体地涉及使用动态模型将输入信号变换为 输出信号,其中所述信号是音频(语音)信号。
技术介绍
用于对非平稳信号中的动力学(dynamics)进行建模的常用框架(framework)是 具有时间动力学的隐马尔可夫模型(HMM,hidden Markov model)。HMM是用于语音识别的 事实(de facto)标准。离散时间HMM通过以与未观测的随机状态变量{hn}的序列有关的 概率分布为条件来对N个观测的(获取的)随机变量 def def {χη} = X1:N= {x ^ X2, · · ·,xN}(即,信号样本)的序列进行建模。通常对HMM限定 两个约束。 首先,状态变量具有一阶马尔可夫动力学。这意味着pOOhm) = P(IinIlv1),其 中PQinItv1)被称为转移(transition)概率。转移概率通常被约束为时不变。 其次,在给定相应的状态hn的情况下的每个样本xn与所有其它隐状态 hn,(n'乒η)无关,使得p(xn|h1:N) =p(xn|hn),其中p(xn|hn)被称为观测概率。在许多语 音应用中,状态匕是离散的,并且观测结果X "是F维向量值的连续的声学特征,【主权项】1. 一种,所述方法包括以下步骤: 将所述输入信号的模型的参数存储到存储器中; 接收所述输入信号作为特征向量的序列; 使用特征向量的所述序列和所述参数来推断隐变量的向量的序列,其中,对于每个特 征向量Xn,存在隐变量hi,n的至少一个向量h n,并且其中,每个隐变量非负; 使用所述特征向量、隐变量的所述向量和所述参数来生成与所述输入信号对应的输出 信号, 其中,每个特征向量Xn依赖于相同η的所述隐变量h 中的至少一个,并且所述隐变 T _ ^ J 量根据= 相关,其中j和1是求和索引,所述参数包括非负权重 Cu1,并且ε l n是独立的非负随机变量,其中,所述步骤在处理器中执行。2. 根据权利要求1所述的方法,其中,c m= δ (i,l)ai j,其中ai j是非15负标量,并 且其中S是克罗内克符号,使得3. 根据权利要求1所述的方法,其中,c m= δ (m(i,j),l)ai j,其中ai j是非负标量, S是克罗内克符号,并且m(i,j)是从i和j的每个组合到与1对应的索引的一对一映射, 使獨4. 根据权利要求1所述的方法,其中,所述随机变量ε &是伽玛分布的。5. 根据权利要求1所述的方法,其中,在所述推断期间使用的观测模型至少部分基于 Vf,n =J]Cfhhi,n£Ln Λν)是非负标量,并且是独立的非负随机变量, j cUJ I,η 是所述输入信号在帧η和特征f处的非负特征,并且j和1是索引。6. 根据权利要求5所述的方法,其中,〇 ,其中Wf,i是非负标量,其中δ克 罗内克符号,并且是伽玛分布的随机变量,使得所述观测模型至少部分 基于其中vf,n是所述输入?目号在帧η处的非负特征,f是频率,GammaC I a, b)是具有形状参 数a和逆尺度参数b的伽玛分布,α(ν)和β w是正标量,并且Wti是非负标量。7. 根据权利要求5所述的方法,所述方法还包括以下步骤: 获得所述特征向量Xtn作为所述输入信号的复谱图,其中xf,n是所述复谱图的对于帧η 和频率f的值,以及 确定非负特征Vf,n= I X f,n 12作为在帧η和频率f下的功率,使得所述观测模型至少部 分基于x/> = ,其中是单位虚数,并且θ?η是表示对于所述 V J 帧η和所述频率f的相位的随机变量。8. 根据权利要求6所述的方法,所述方法还包括以下步骤: 设置所述参数α(ν)= 1,并且其中Θ f n是均匀分布的随机相位变量,使得 /(V,《丨~)=~(〇, Σν,Ανζ),其中Nc是复高斯分布。 i9. 根据权利要求1所述的方法,其中,所述推断使用最大后验估计。10. 根据权利要求1所述的方法,其中,所述推断使用变分贝叶斯方法。11. 根据权利要求1所述的方法,其中,所述推断是自适应的,并且对所述输入信号实 时执行所述推断。12. 根据权利要求1所述的方法,其中,所述输入信号从多个通道同时接收。13. 根据权利要求1所述的方法,其中,在所述推断期间使用的观测模型至少部分基于,和/(,是非负标量,并且和是独立的非负随机变量,并且i、 和η是索引。14. 根据权利要求1所述的方法,其中,所述隐变量h 被划分成S个组,并且所述非负 随机变量ε1:η各自与所述组中的一个关联,其中,当hi^Phu、或者ε &在不同的 组中时,Cm= 0。15. 根据权利要求1所述的方法,其中,所述模型是动态的,并且所述输入信号是非平 稳的。16. 根据权利要求1所述的方法,所述方法还包括以下步骤: 在所述推断期间实时适应于所述输入信号的增益。17. 根据权利要求1所述的方法,其中,所述输入信号是语音和噪声的混合信号,并且 所述输出信号是增强的语音信号。18. 根据权利要求1所述的方法,其中,所述参数包括基函数W、转移矩阵Α、激活矩阵 Η、固定形状参数α、连续伽玛分布参数的逆尺度参数β及其各种组合。19. 根据权利要求18所述的方法,其中,更新H和β是可选的。20. 根据权利要求18所述的方法,其中,更新β在由所述推断使用的最大后验估计中 是可选的。21. 根据权利要求1所述的方法,其中,所述输入信号由单个传感器从多个源同时接 收。22.根据权利要求18所述的方法,其中,在变分贝叶斯方法中使用H的后验分布。【专利摘要】形式为特征向量的序列的输入信号通过首先将所述输入信号的模型的参数存储到存储器中被变换为输出信号。使用所述向量和所述参数,推断隐变量的向量的序列。对于每个特征向量xn,存在隐变量hi,n的至少一个向量hn,并且每个隐变量非负。使用所述特征向量、隐变量的所述向量和所述参数来生成所述输出信号。每个特征向量xn依赖于相同n的所述隐变量hi,n中的至少一个。所述隐变量根据公式相关,其中j和l是求和索引。所述参数包括非负权重ci,j,l,并且εl,n是独立的非负随机变量。【IPC分类】G10L21-0232, G10L21-0216【公开号】CN104737229【申请号】CN201380054925【专利技术人】J·R·赫尔歇, C·费沃特, J·勒鲁克斯 【申请人】三菱电机株式会社【公开日】2015年6月24日【申请日】2013年10月17日【公告号】DE112013005085T5, US20140114650, WO2014065342A1本文档来自技高网...

【技术保护点】
一种用于变换输入信号的方法,所述方法包括以下步骤:将所述输入信号的模型的参数存储到存储器中;接收所述输入信号作为特征向量的序列;使用特征向量的所述序列和所述参数来推断隐变量的向量的序列,其中,对于每个特征向量xn,存在隐变量hi,n的至少一个向量hn,并且其中,每个隐变量非负;使用所述特征向量、隐变量的所述向量和所述参数来生成与所述输入信号对应的输出信号,其中,每个特征向量xn依赖于相同n的所述隐变量hi,n中的至少一个,并且所述隐变量根据相关,其中j和l是求和索引,所述参数包括非负权重ci,j,l,并且εl,n是独立的非负随机变量,其中,所述步骤在处理器中执行。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:J·R·赫尔歇C·费沃特J·勒鲁克斯
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1