一种基于子空间的非特定人孤立词识别方法及装置制造方法及图纸

技术编号：7809631 阅读：233 留言：0更新日期：2012-09-27 11:59

本发明专利技术涉及自动语音识别领域，特别是一种基于子空间技术的非特定人孤立词识别方法和装置。该方法的特征在于将子空间技术应用到隐含马尔科夫模型中，首先利用所有语音数据训练全局模型，随后采用子空间自适应的方法，刻画声学基元模型，并依此建立隐含马尔可夫模型。该装置包括：语音预处理模块、特征提取模块、建立模型模块、模型匹配模块和分数判决模块。本发明专利技术在有限数据条件下能够稳健估值。适用于训练和识别语音数据有限条件下，中等规模词表的非特定人孤立词识别。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及自动语音识别领域，具体而言，是ー种基于子空间技术的非特定人孤立词识别方法及装置。
技术介绍
语音是人类最自然、最灵活、最频繁的信息交流方式。语音中蕴含多层信息，如何自动提取这些信息便成为当前语音信号处理领域的主要研究内容。作为该领域的ー个重要分支，孤立词(Isolated Word Recognition, IffR)是利用计算机，自动从语音片段中提取内容的识别技术，在汽车导航、计算机控制、玩具等诸多领域有广泛的应用。目前，非特定人孤立词识别主要利用统计模式识别的方法，分为训练和测试两个阶段。训练阶段可分为三个步骤前端处理，特征提取和建立模型；测试阶段可分为四个步骤前端处理，特征提取，模型匹配和分数判決。通常而言，(I)前端处理包括语音增强、活动语音检测和语音切分等信号处理技术；(2)特征提取通常选择线性预测倒谱系数(Linear Predictive CepstralCoefficients, LPCC)、梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficient, MFCC)或感知线性预测(Perceptual Linear Prediction, PLP)；(3)建模方法(建立模型和模型匹配)主流技术是隐含马尔科夫模型(HiddenMarkov Model, HMM)；(4)分数判决根据阈值，对分数进行比较，对HMM的输出分数进行处理，给出识别结果。在上述过程中，建模方法是最为重要的ー个环节。对于非特定人的IWR算法，在进行HMM建模时，需要选择建模基元，通常有三种方法(I)整词把词作为建模的基本単元；(...

【技术保护点】

【技术特征摘要】
1.一种基于子空间的非特定人孤立词建模方法，其特征在于，将子空间技术融入隐含马尔科夫模型框架，从而降低建模的自由度，在有限数据量的情况下，能够提高所估计模型的准确度，提升系统的识别性能。2.根据权利要求I所述的，用于非特定人孤立词识别的子空间建模方法，其特征在于所述方法适用于不同声学基元，包括音节、半音节和声韵母。3.根据权利要求I所述的，用于非特定人孤立词识别的予空间建模方法，其特征在于所建立的模型既可适用于单因子模型，也可以适用于双因子、三音子模型。4.根据权利要求I所述的，用于孤立词识别的子空间建模方法是与语种无关的。5.一种基于子空间的孤立词识别装置，其特征在于，该装置分为5个模块...

【专利技术属性】
技术研发人员：何亮，巴福生，
申请(专利权)人：北京安慧音通科技有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人