改进神经网络语言模型的方法和装置及语音识别方法和装置制造方法及图纸

技术编号：14765634 阅读：66 留言：0更新日期：2017-03-08 09:43

本发明专利技术提供改进语音识别系统的神经网络语言模型的方法、改进语音识别系统的神经网络语言模型的装置、语言识别方法以及语音识别装置。根据一个实施方式的改进语音识别系统的神经网络语言模型的装置，包括：词分类单元，其对上述语音识别系统的词典中的词进行分类；语言模型训练单元，其基于分类的结果训练基于类的语言模型；和向量拼接单元，其将上述基于类的语言模型的输出向量与上述神经网络语言模型的位置指示向量拼接，作为上述神经网络语言模型的输入向量。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音识别系统，具体涉及改进语音识别系统的神经网络语言模型的方法、改进语音识别系统的神经网络语言模型的装置、语言识别方法以及语音识别装置。
技术介绍
语音识别系统一般包含声学模型(AM)和语言模型(LM)两个部分。声学模型是统计语音特征对音素单元概率分布的模型，语言模型是统计词序列(词汇上下文)出现概率的模型，语音识别过程是根据两个模型的概率得分的加权和得到得分最高的结果。作为语言模型中最为经典的方法，统计回退语言模型，如ARPALM，几乎应用于所有的语音识别系统中。这类模型是一种离散式的非参数化的模型，即直接用词序列的频率来统计出概率。近几年，神经网络语言模型(NNLM)作为一种新方法被引入语音识别系统，极大地提高了识别性能，其中，深度神经网络(DNN)和递归神经网络(RNN)是两种最具代表性的技术。上述神经网络LM是一种参数化的统计模型，对语音识别系统词汇的量化采用位置指示向量作为词汇特征，该词汇特征为神经网络LM的输入，而输出为在某词序列历史的条件下，系统词典中每个词作为下一个词出现的概率。每个词汇的特征为位置指示向量，即在以语音识别系统词典大小为维数的向量中将对应某词汇在系统词典中的位置的元素标为“1”，而其他元素均为“0”。
技术实现思路
本专利技术者们发现，位置指示向量仅包含了词汇在系统词典中的位置信息，因此，以往的神经网络语言模型对词序列出现概率的学习和预测能力还存在进一步改进的余地。为了进一步改进神经网络语言模型对词序列出现概率的学习和预测能力，本专利技术提出了将其他信息加入位置指示向量中，从而提高神经网络语言模型对词序列出现概率...
<a href="http://www.xjishu.com/zhuanli/21/201510543232.html" title="改进神经网络语言模型的方法和装置及语音识别方法和装置原文来自X技术">改进神经网络语言模型的方法和装置及语音识别方法和装置</a>

【技术保护点】
一种改进语音识别系统的神经网络语言模型的装置，包括：词分类单元，其对上述语音识别系统的词典中的词进行分类；语言模型训练单元，其基于分类的结果训练基于类的语言模型；和向量拼接单元，其将上述基于类的语言模型的输出向量与上述神经网络语言模型的位置指示向量拼接，作为上述神经网络语言模型的输入向量。

【技术特征摘要】
1.一种改进语音识别系统的神经网络语言模型的装置，包括：词分类单元，其对上述语音识别系统的词典中的词进行分类；语言模型训练单元，其基于分类的结果训练基于类的语言模型；和向量拼接单元，其将上述基于类的语言模型的输出向量与上述神经网络语言模型的位置指示向量拼接，作为上述神经网络语言模型的输入向量。2.根据权利要求1所述的改进神经网络语言模型的方法，其中，上述词分类单元，基于预定的标准对上述词典中的词进行分类。3.根据权利要求2所述的改进神经网络语言模型的方法，其中，上述预定的标准包括词性、语义和语用信息。4.根据权利要求3所述的改进神经网络语言模型的方法，其中，上述词分类单元，基于词性以预定的分类方式对上述词典中的词进行分类。5.根据权利要求1-4的任一项所述的改进神经网络语言模型的方法，其中，上述语言模型训练单元，以预定的阶数训练基于类的语言模型。6.根据权利要求1-4的任一项所述的改进神经网络语言模型的方法，其中，上述...

【专利技术属性】
技术研发人员：丁沛，雍坤，朱会峰，郝杰，
申请(专利权)人：株式会社东芝，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人