语音识别方法和装置制造方法及图纸

技术编号：14189879 阅读：93 留言：0更新日期：2016-12-15 01:51

本申请提出一种语音识别方法和装置，该语音识别方法包括：对输入的语音进行声学特征提取，得到声学特征；获取声学模型，其中，所述声学模型的参数是二值化参数；根据所述声学特征和所述声学模型进行语音识别。该方法能够适用于嵌入式语音识别。

Speech recognition method and apparatus

The invention provides a speech recognition method and apparatus, including the speech recognition method of input speech acoustic feature extraction, get acoustic characteristics; obtain acoustic model, the parameters of the acoustic model is binarization parameters; according to the acoustic characteristics of speech recognition and the acoustic model. This method can be applied to embedded speech recognition.

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及语音处理
，尤其涉及一种语音识别方法和装置。
技术介绍
随着智能手机、平板电脑等移动设备的不断普及，语音作为一种自然的人机交互手段，在人们的日常生活工作中发挥着越来重要的作用。语音识别用于将语音识别为文本。语音识别可以分为联网语音识别和嵌入式语音识别，联网语音识别是指用户通过网络将语音信号上传给服务器，由服务器进行语音识别，并将识别结果返回给用户。嵌入式语音识别是指用户通过嵌入在智能终端内的语音识别器进行语音识别。语音识别的一个关键部分是声学模型，目前生成的声学模型都比较大。因此无法直接将服务器使用的声学模型直接应用于智能终端，需要给出适用于嵌入式语音识别的解决方案。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本申请的一个目的在于提出一种语音识别方法，该方法可以适用于嵌入式语音识别。本申请的另一个目的在于提出一种语音识别装置。为达到上述目的，本申请第一方面实施例提出的语音识别方法，包括：对输入的语音进行声学特征提取，得到声学特征；获取声学模型，其中，所述声学模型的参数是二值化参数；根据所述声学特征和所述声学模型进行语音识别。本申请第一方面实施例提出的语音识别方法，通过采用参数是二值化参数的声学模型，可以显著减小声学模型的大小，降低所需存储空间，从而可以适用于嵌入式语音识别。为达到上述目的，本申请第二方面实施例提出的语音识别装置，包括：特征提取模块，用于对输入的语音进行声学特征提取，得到声学特征；获取模块，用于获取声学模型，其中，所述声学模型的参数是二值化参数；识别模块，用于根据所述声学特征和所述声学模型进行语...
语音识别方法和装置

【技术保护点】
一种语音识别方法，其特征在于，包括：对输入的语音进行声学特征提取，得到声学特征；获取声学模型，其中，所述声学模型的参数是二值化参数；根据所述声学特征和所述声学模型进行语音识别。

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：对输入的语音进行声学特征提取，得到声学特征；获取声学模型，其中，所述声学模型的参数是二值化参数；根据所述声学特征和所述声学模型进行语音识别。2.根据权利要求1所述的方法，其特征在于，还包括：训练生成所述声学模型，其中，在训练过程中包括利用误差反传方法计算误差，且误差的精度为浮点精度。3.根据权利要求1所述的方法，其特征在于，所述根据所述声学特征和所述声学模型进行语音识别，包括：在所述声学模型包括DNN时，将所述声学特征作为所述DNN的输入层，且，在所述DNN的每个隐层，采用声学模型的参数与输入值进行运算得到输出值，以及，对存在下一个隐层的输出值进行二值化，以作为下一个隐层的输入值。4.根据权利要求3所述的方法，其特征在于，还包括：对输出值进行线性变换，以对变换后的输出值进行二值化。5.根据权利要求3所述的方法，其特征在于，所述采用声学模型的参数与输入值进行运算得到输出值，包括：根据声学模型的参数与输入值进行位操作，得到输出值。6.一种语音识别装置，其特...

【专利技术属性】
技术研发人员：丁科，蒋兵，李先刚，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人