改进神经网络语言模型的方法和装置及语音识别方法和装置制造方法及图纸

技术编号:14765634 阅读:66 留言:0更新日期:2017-03-08 09:43
本发明专利技术提供改进语音识别系统的神经网络语言模型的方法、改进语音识别系统的神经网络语言模型的装置、语言识别方法以及语音识别装置。根据一个实施方式的改进语音识别系统的神经网络语言模型的装置,包括:词分类单元,其对上述语音识别系统的词典中的词进行分类;语言模型训练单元,其基于分类的结果训练基于类的语言模型;和向量拼接单元,其将上述基于类的语言模型的输出向量与上述神经网络语言模型的位置指示向量拼接,作为上述神经网络语言模型的输入向量。

【技术实现步骤摘要】

本专利技术涉及语音识别系统,具体涉及改进语音识别系统的神经网络语言模型的方法、改进语音识别系统的神经网络语言模型的装置、语言识别方法以及语音识别装置。
技术介绍
语音识别系统一般包含声学模型(AM)和语言模型(LM)两个部分。声学模型是统计语音特征对音素单元概率分布的模型,语言模型是统计词序列(词汇上下文)出现概率的模型,语音识别过程是根据两个模型的概率得分的加权和得到得分最高的结果。作为语言模型中最为经典的方法,统计回退语言模型,如ARPALM,几乎应用于所有的语音识别系统中。这类模型是一种离散式的非参数化的模型,即直接用词序列的频率来统计出概率。近几年,神经网络语言模型(NNLM)作为一种新方法被引入语音识别系统,极大地提高了识别性能,其中,深度神经网络(DNN)和递归神经网络(RNN)是两种最具代表性的技术。上述神经网络LM是一种参数化的统计模型,对语音识别系统词汇的量化采用位置指示向量作为词汇特征,该词汇特征为神经网络LM的输入,而输出为在某词序列历史的条件下,系统词典中每个词作为下一个词出现的概率。每个词汇的特征为位置指示向量,即在以语音识别系统词典大小为维数的向量中将对应某词汇在系统词典中的位置的元素标为“1”,而其他元素均为“0”。
技术实现思路
本专利技术者们发现,位置指示向量仅包含了词汇在系统词典中的位置信息,因此,以往的神经网络语言模型对词序列出现概率的学习和预测能力还存在进一步改进的余地。为了进一步改进神经网络语言模型对词序列出现概率的学习和预测能力,本专利技术提出了将其他信息加入位置指示向量中,从而提高神经网络语言模型对词序列出现概率的学习和预测能力的方法和装置。也就是说,本专利技术提供了改进语音识别系统的神经网络语言模型的方法和装置,并进一步提供了语音识别方法和语音识别装置。具体地,提供了以下技术方案。[1]一种改进语音识别系统的神经网络语言模型的装置,具备:词分类单元,其对上述语音识别系统的词典中的词进行分类;语言模型训练单元,其基于分类的结果训练基于类的语言模型;和向量拼接单元,其将上述基于类的语言模型的输出向量与上述神经网络语言模型的位置指示向量拼接,作为上述神经网络语言模型的输入向量。根据上述[1]的改进语音识别系统的神经网络语言模型的装置,可以将基于类的语言模型的向量作为附加特征加入神经网络语言模型的输入向量,能够提高神经网络语言模型对词序列出现概率的学习和预测能力。[2]根据上述[1]的改进神经网络语言模型的装置,其中,上述词分类单元,基于预定的标准对上述词典中的词进行分类。[3]根据上述[2]的改进神经网络语言模型的装置,其中,上述预定的标准包括词性、语义和语用信息。根据上述[2]和[3]的改进神经网络语言模型的装置,可以以多个标准对词典中的词进行分类,由此,能够提高对词典中的词分类的多样性。并且,根据不同的分类标准,可相应地得到不同的基于类的语言模型,由此,能够提高基于类的语言模型的多样性。[4]根据上述[3]所述的改进神经网络语言模型的装置,其中,上述词分类单元,基于词性以预定的分类方式对上述词典中的词进行分类。根据上述[4]的改进神经网络语言模型的装置,在以词性为标准对词典中的词进行分类时,能够进一步以例如100种词性和315种词性的分类方式对词典中的词进行分类,能够进一步提高对词典分类的多样性。并且,根据不同的分类方式,可相应地得到不同的基于类的语言模型,由此,能够进一步提高基于类的语言模型的多样性。[5]根据上述[1]-[4]的任一项的改进神经网络语言模型的装置,其中,上述语言模型训练单元,以预定的阶数训练基于类的语言模型。根据上述[5]的改进神经网络语言模型的装置,能够以预定的阶数训练基于类的语言模型,例如,可以以3-gram、4-gram训练基于类的语言模型,根据不同的阶数,可相应地得到不同的基于类的语言模型,由此,能够提高基于类的语言模型的多样性。[6]根据上述[1]-[4]的任一项的改进神经网络语言模型的装置,其中,上述基于类的语言模型包括APRA语言模型、NN语言模型和RF语言模型。[7]根据上述[6]的改进神经网络语言模型的装置,其中,上述NN语言模型包括DNN语言模型和RNN语言模型。根据上述[6]和[7]的改进神经网络语言模型的装置,基于类的语言模型例如可以是APRA语言模型、DNN语言模型、RNN语言模型和RF语言模型,根据不同类型的语言模型,可相应地得到不同的基于类的语言模型,由此,能够提高基于类的语言模型的多样性。[8]一种语音识别装置,具备:语音输入单元,其用于输入待识别的语音;文本句识别单元,其利用声学模型将上述语音识别为文本句;和得分计算单元,其利用语言模型计算上述文本句的得分;所述语言模型包括由上述[1]-[7]的任一项的装置改进后的语言模型。根据上述[7]的语音识别装置,使用了由上述[1]-[7]的任一项的装置改进后的语言模型,由此,可以将基于类的语言模型的向量作为附加特征加入神经网络语言模型的输入向量,能够提高神经网络语言模型对词序列出现概率的学习和预测能力。另外,能够提高基于类的语言模型的多样性。[9]根据上述[8]所述的语音识别装置,还具备:平均值计算单元,其计算利用两个以上的语言模型分别计算出的得分的加权平均值,作为上述文本句的得分。根据上述[9]的语音识别装置,计算利用两个以上的语言模型分别计算出的得分的加权平均值,作为上述文本句的得分,由此,能够进一步提高识别准确率。具体地,由于分类标准多种多样(例如词性、语义、语用信息等),同一分类标准也有不同的分类方式(例如,对于词性分类有100种词性分类和315种词性分类等),同一分类标准也有不同上下文阶数(例如3-gram、4-gram等)的语言模型,语言模型也有多种选择(例如APRA语言模型、DNN语言模型、RNN语言模型和RF语言模型等),因此能够提高对词典中的词分类的多样性,与此相应,也能提高训练出的基于类的语言模型的多样性,得到多种以基于类的语言模型的得分为附加特征而改进了的神经网络语言模型,再将这些神经网络语言模型进行融合时可进一步提高识别准确率,提高识别性能。[10]一种改进语音识别系统的神经网络语言模型的方法,包括:对上述语音识别系统的词典中的词进行分类;基于分类的结果训练基于类的语言模型;和将上述基于类的语言模型的输出向量与上述神经网络语言模型的位置指示向量拼接,作为上述神经网络语言模型的输入向量。根据上述[10]的改进语音识别系统的神经网络语言模型的方法,可以将基于类的语言模型的向量作为附加特征加入神经网络语言模型的输入向量,能够提高神经网络语言模型对词序列出现概率的学习和预测能力。[11]根据上述[10]的改进神经网络语言模型的方法,其中,对上述词典中的词进行分类的步骤包括:基于预定的标准对上述词典中的词进行分类。[12]根据上述[11]的改进神经网络语言模型的方法,其中,上述预定的标准包括词性、语义和语用信息。根据上述[11]和[12]的改进神经网络语言模型的方法,可以以多个标准对词典中的词进行分类,由此,能够提高对词典中的词分类的多样性。并且,根据不同的分类标准,可相应地得到不同的基于类的语言模型,由此,能够提高基于类的语言模型的多本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/21/201510543232.html" title="改进神经网络语言模型的方法和装置及语音识别方法和装置原文来自X技术">改进神经网络语言模型的方法和装置及语音识别方法和装置</a>

【技术保护点】
一种改进语音识别系统的神经网络语言模型的装置,包括:词分类单元,其对上述语音识别系统的词典中的词进行分类;语言模型训练单元,其基于分类的结果训练基于类的语言模型;和向量拼接单元,其将上述基于类的语言模型的输出向量与上述神经网络语言模型的位置指示向量拼接,作为上述神经网络语言模型的输入向量。

【技术特征摘要】
1.一种改进语音识别系统的神经网络语言模型的装置,包括:词分类单元,其对上述语音识别系统的词典中的词进行分类;语言模型训练单元,其基于分类的结果训练基于类的语言模型;和向量拼接单元,其将上述基于类的语言模型的输出向量与上述神经网络语言模型的位置指示向量拼接,作为上述神经网络语言模型的输入向量。2.根据权利要求1所述的改进神经网络语言模型的方法,其中,上述词分类单元,基于预定的标准对上述词典中的词进行分类。3.根据权利要求2所述的改进神经网络语言模型的方法,其中,上述预定的标准包括词性、语义和语用信息。4.根据权利要求3所述的改进神经网络语言模型的方法,其中,上述词分类单元,基于词性以预定的分类方式对上述词典中的词进行分类。5.根据权利要求1-4的任一项所述的改进神经网络语言模型的方法,其中,上述语言模型训练单元,以预定的阶数训练基于类的语言模型。6.根据权利要求1-4的任一项所述的改进神经网络语言模型的方法,其中,上述...

【专利技术属性】
技术研发人员:丁沛雍坤朱会峰郝杰
申请(专利权)人:株式会社东芝
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1