语音识别方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号：23192182 阅读：78 留言：0更新日期：2020-01-24 16:42

本发明专利技术提供了一种语音识别方法、装置、设备及计算机可读存储介质，其中该方法包括：获取输入的语音信号，并对所述语音信号进行预处理，得到所述语音信号的目标语音参数；利用脉冲神经网络模型对所述目标语音参数进行第一识别，得到最优识别序列；利用圆映射方法对所述最优识别序列进行第二识别，得到所述语音信号的识别结果。本发明专利技术能提高语音识别的精确度。

Speech recognition method, device, equipment and computer readable storage medium

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、装置、设备及计算机可读存储介质
本专利技术涉及人工智能
，特别涉及一种语音识别方法、装置、设备及计算机可读存储介质。
技术介绍
自20世纪80年代以来，语音识别技术的研究取得了引人注目的成就。目前，基于隐马尔可夫模型(HMM，HiddenMarkovModels)的语音识别技术日趋成熟，被广泛应用于众多的语音识别系统中。但是，HMM模型也存在一些局限性，比如声学模型存在量化误差和模型参数假设；一阶HMM假设很难直接用模型描述协同发音；独立性假设则忽略了帧间的相关性；HMM方法不同于人脑对语音的处理理解方式，其自适应能力、鲁棒性都不理想。这些局限性使得在使用单一的HMM模型方法识别语音时，语音识别的精确度欠佳。
技术实现思路
本专利技术提供了一种语音识别方法、装置、设备及计算机可读存储介质，其目的是为了解决语音识别的精确度欠佳的问题。为了达到上述目的，本专利技术的实施例提供了一种语音识别方法，包括：获取输入的语音信号，并对所述语音信号进行预处理，得到所述语音信号的目标语音参数；利用脉冲神经网络模型对所述目标语音参数进行第一识别，得到最优识别序列；利用圆映射方法对所述最优识别序列进行第二识别，得到所述语音信号的识别结果。其中，所述对所述语音信号进行预处理，得到所述语音信号的目标语音参数的步骤，包括：对所述语音信号进行去噪处理；将去噪处理后的语音信号转换为语音数字信号，并对语音数字信号进行预加重处理；对预加重处理后的语音...

【技术保护点】
1.一种语音识别方法，其特征在于，包括：/n获取输入的语音信号，并对所述语音信号进行预处理，得到所述语音信号的目标语音参数；/n利用脉冲神经网络模型对所述目标语音参数进行第一识别，得到最优识别序列；/n利用圆映射方法对所述最优识别序列进行第二识别，得到所述语音信号的识别结果。/n

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：
获取输入的语音信号，并对所述语音信号进行预处理，得到所述语音信号的目标语音参数；
利用脉冲神经网络模型对所述目标语音参数进行第一识别，得到最优识别序列；
利用圆映射方法对所述最优识别序列进行第二识别，得到所述语音信号的识别结果。

2.根据权利要求1所述的方法，其特征在于，所述对所述语音信号进行预处理，得到所述语音信号的目标语音参数的步骤，包括：
对所述语音信号进行去噪处理；
将去噪处理后的语音信号转换为语音数字信号，并对语音数字信号进行预加重处理；
对预加重处理后的语音数字信号进行加窗分帧处理，得到多帧预加重语音数字信号；
通过对每帧预加重语音数字信号进行端点检测，确定每帧预加重语音数字信号的起止点；
提取每帧预加重语音数字信号的语音信号特征参数，并将提取到的语音信号特征参数作为所述语音信号的目标语音参数。

3.根据权利要求2所述的方法，其特征在于，每帧预加重语音数字信号的语音信号特征参数包括：预加重语音数字信号的语音信号幅度、预加重语音数字信号的信号过零率、预加重语音数字信号的信号基音频率、预加重语音数字信号的信号线性预测的系数、预加重语音数字信号的信号线性预测倒谱系数。

4.根据权利要求1所述的方法，其特征在于，所述利用脉冲神经网络模型对所述目标语音参数进行第一识别，得到最优识别序列的步骤，包括：
将所述目标语音参数作为H-H脉冲神经网络模型的输入电流；
通过所述H-H脉冲神经网络模型对所述目标语音参数进行识别，得到最优识别序列。

5.根据权利要求1所述的方法，其特征在于，所述利用圆映射方法对所述最优识别序列进行第二识别，得到所述语音信号的识别结果...

【专利技术属性】
技术研发人员：马蛟龙，
申请(专利权)人：甘肃龙科智能科技有限公司，
类型：发明
国别省市：甘肃;62

全部详细技术资料下载我是这个专利的主人