用于语音识别的n元文法模型构造方法及语音识别系统技术方案

技术编号：12730621 阅读：82 留言：0更新日期：2016-01-20 14:30

本发明专利技术提供一种用于语音识别的n元文法模型构造方法及语音识别系统，所述方法包含：步骤101)通过神经网络语言模型训练得到词矢量，再对词矢量进行分类以及多层筛选，最终得到词类；步骤102)利用直接统计词频的方法扩充人工标注，即同类词替换时，直接统计与原句有变化的1至n元文法组合，进而得到扩充部分的n元文法模型；步骤103)人工标注生成初步的n元文法模型，再与扩充部分的n元文法模型进行模型插值，得到最终的n元文法模型。所述步骤101)进一步包含：步骤101-1)输入标注及训练文本；步骤101-2)通过神经网络语言模型训练得到词典中的词的相应词矢量；步骤101-3)用K均值法对词矢量分类；步骤101-4)对分类结果进行多层筛选，最终得到词类。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种在语音识别中，利用词矢量分类来扩展人工标注训练语料，以提升语言模型的方法，具体提供一种用于语音识别的η元文法模型构造方法及语音识别系统。
技术介绍
目前采用的语言模型建模技术主要是η元文法语言模型（n-gram Language Model)。该模型因其训练简单，复杂度低，使用方便等优势，在语音识别领域得到广泛的应用。但是，η元文法模型核心思想是通过词频统计来建模，在资源匮乏的领域，比如面向电话交谈的语音（CTS)识别系统，由于语料规模是有限的，存在大量训练语料中没有出现的文法组合，只能依靠平滑算法给那些概率为零的文法附上一个很小的概率。即使如此，数据稀疏问题依然是效果不理想的主要原因。 η元文法语言模型运用于语音识别领域，实践表明用户语音的人工标注的加入对于模型性能的提升是效果显著。但是人工标注的获得费时费力，因此数据量十分有限，如何更充分地利用人工标注语料成为人们的研究目标。常用做法是依据标注的文法规则特点，扩展出更多风格相近的语料，加入到模型中。之前的研究在这一问题上提出了一些方法，t匕如依据已有的句子总结出一些句型，对于空缺的词利用同义词词林进行同义词扩展；也有利用互信息来对词典进行分类，产生的词类用于扩展语料。近年来，神经网络建模技术在语言模型中得到应用。η元文法语言模型是在离散空间上建模，词与词相互之间仅有语法结构上的联系，并无语义上的联系。而神经网络模型在连续空间建模，能有效挖掘更深层的语言信息。词矢量是神经网络建模过程中可得到的产物，每个词由一个远小于词典词个数的维度的矢量表示，...

【技术保护点】
一种用于语音识别的n元文法模型构造方法，所述方法包含：步骤101)通过神经网络语言模型训练得到词矢量，再对词矢量进行分类以及多层筛选，最终得到词类；步骤102)利用直接统计词频的方法扩充人工标注，即同类词替换时，直接统计与原句有变化的1至n元文法组合，进而得到扩充部分的n元文法模型；步骤103)人工标注生成初步的n元文法模型，再与扩充部分的n元文法模型进行模型插值，得到最终的n元文法模型。

【技术特征摘要】

【专利技术属性】
技术研发人员：张晴晴，陈梦喆，潘接林，颜永红，
申请(专利权)人：中国科学院声学研究所，北京中科信利技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人