语音识别方法和装置制造方法及图纸

技术编号：13200603 阅读：27 留言：0更新日期：2016-05-12 10:09

本发明专利技术提出一种语音识别方法和装置，其中，该语音识别方法，包括以下步骤：接收语音信号；根据预先建立的声学模型、语言模型和解码网络对所述语音信号进行解码，并在解码过程中动态添加空白单元，以得到添加空白单元后的最优解码路径，其中，所述声学模型是基于连接时序分类训练得到的，所述声学模型中包括基本发音单元和所述空白单元，所述解码网络由所述基本发音单元构成的多个解码路径组成；将所述最优解码路径输出为所述语音信号的识别结果。本发明专利技术的语音识别方法，能够提高语音识别的准确性，并提高识别过程中的解码速度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音识别
，特别涉及一种语音识别方法和装置。
技术介绍
传统的语音识别技术，大多是基于状态建模的语音识别模型进行语音识别的。例如，基于隐马尔科夫模型(Hidden Markov Model;以下简称:HMM)进行语音识别。HMM可以看作一个数学上的双重随机过程:一个是用具有有限状态数的马尔科夫Markov链来模拟语音信号统计特性变化的隐含的随机过程，另一个是与马尔科夫Markov链的每一个状态相关联的观测序列的随机过程。在这种建模方式中，一个音素或者一个音节被认为可分为多个没有物理意义的状态，然后采用离散或者连续高斯模型或深度学习模型描述每个状态的输出分布。但是，基于状态建模的方式，在语音识别的过程中，在对两个发音单元之间处进行识别时，容易出现混淆，识别性能较差。
技术实现思路
本专利技术旨在至少在一定程度上解决上述技术问题。为此，本专利技术的第一个目的在于提出一种语音识别方法，能够提高语音识别的准确性，并提高识别过程中的解码速度。本专利技术的第二个目的在于提出一种语音识别装置。为达上述目的，根据本专利技术第一方面实施例提出了一种语音识别方法，包括以下步骤:接收语音信号;根据预先建立的声学模型、语言模型和解码网络对所述语音信号进行解码，并在解码过程中动态添加空白单元，以得到添加空白单元后的最优解码路径，其中，所述声学模型是基于连接时序分类训练得到的，所述声学模型中包括基本发音单元和所述空白单元，所述解码网络由所述基本发音单元构成的多个解码路径组成;将所述最优解码路径输出为所述语音信号的识别结果。本专利技术实施例的语音识别方法，...

【技术保护点】
一种语音识别方法，其特征在于，包括以下步骤：接收语音信号；根据预先建立的声学模型、语言模型和解码网络对所述语音信号进行解码，并在解码过程中动态添加空白单元，以得到添加空白单元后的最优解码路径，其中，所述声学模型是基于连接时序分类训练得到的，所述声学模型中包括基本发音单元和所述空白单元，所述解码网络由所述基本发音单元构成的多个解码路径组成；将所述最优解码路径输出为所述语音信号的识别结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：钱胜，潘复平，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人