语音识别方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:23192182 阅读:78 留言:0更新日期:2020-01-24 16:42
本发明专利技术提供了一种语音识别方法、装置、设备及计算机可读存储介质,其中该方法包括:获取输入的语音信号,并对所述语音信号进行预处理,得到所述语音信号的目标语音参数;利用脉冲神经网络模型对所述目标语音参数进行第一识别,得到最优识别序列;利用圆映射方法对所述最优识别序列进行第二识别,得到所述语音信号的识别结果。本发明专利技术能提高语音识别的精确度。

Speech recognition method, device, equipment and computer readable storage medium

【技术实现步骤摘要】
语音识别方法、装置、设备及计算机可读存储介质
本专利技术涉及人工智能
,特别涉及一种语音识别方法、装置、设备及计算机可读存储介质。
技术介绍
自20世纪80年代以来,语音识别技术的研究取得了引人注目的成就。目前,基于隐马尔可夫模型(HMM,HiddenMarkovModels)的语音识别技术日趋成熟,被广泛应用于众多的语音识别系统中。但是,HMM模型也存在一些局限性,比如声学模型存在量化误差和模型参数假设;一阶HMM假设很难直接用模型描述协同发音;独立性假设则忽略了帧间的相关性;HMM方法不同于人脑对语音的处理理解方式,其自适应能力、鲁棒性都不理想。这些局限性使得在使用单一的HMM模型方法识别语音时,语音识别的精确度欠佳。
技术实现思路
本专利技术提供了一种语音识别方法、装置、设备及计算机可读存储介质,其目的是为了解决语音识别的精确度欠佳的问题。为了达到上述目的,本专利技术的实施例提供了一种语音识别方法,包括:获取输入的语音信号,并对所述语音信号进行预处理,得到所述语音信号的目标语音参数;利用脉冲神经网络模型对所述目标语音参数进行第一识别,得到最优识别序列;利用圆映射方法对所述最优识别序列进行第二识别,得到所述语音信号的识别结果。其中,所述对所述语音信号进行预处理,得到所述语音信号的目标语音参数的步骤,包括:对所述语音信号进行去噪处理;将去噪处理后的语音信号转换为语音数字信号,并对语音数字信号进行预加重处理;对预加重处理后的语音数字信号进行加窗分帧处理,得到多帧预加重语音数字信号;通过对每帧预加重语音数字信号进行端点检测,确定每帧预加重语音数字信号的起止点;提取每帧预加重语音数字信号的语音信号特征参数,并将提取到的语音信号特征参数作为所述语音信号的目标语音参数。其中,每帧预加重语音数字信号的语音信号特征参数包括:预加重语音数字信号的语音信号幅度、预加重语音数字信号的信号过零率、预加重语音数字信号的信号基音频率、预加重语音数字信号的信号线性预测的系数、预加重语音数字信号的信号线性预测倒谱系数。其中,所述利用脉冲神经网络模型对所述目标语音参数进行第一识别,得到最优识别序列的步骤,包括:将所述目标语音参数作为H-H脉冲神经网络模型的输入电流;通过所述H-H脉冲神经网络模型对所述目标语音参数进行识别,得到最优识别序列。其中,所述利用圆映射方法对所述最优识别序列进行第二识别,得到所述语音信号的识别结果的步骤,包括:利用圆映射方法对所述最优识别序列进行脉冲编码,将所述最优识别序列转化为符号序列;计算所述符号序列与本地语音参数模板库中各语音序列之间的相似度,并将与所述符号序列相似度最高的语音序列作为目标序列;将所述本地语音参数模板库中所述目标序列对应的语言文本作为所述语音信号的识别结果。其中,所述利用圆映射方法对所述最优识别序列进行脉冲编码,将所述最优识别序列转化为符号序列的步骤,包括:在圆映射取相位的过程中,将所述最优识别序列作为圆映射的时间参考,得到相位序列,并将得到的相位序列作为符号序列。其中,在所述利用圆映射方法对所述最优识别序列进行第二识别,得到所述语音信号的识别结果的步骤之后,所述方法还包括:输出所述语音信号的识别结果。本专利技术的实施例还提供了一种语音识别装置,包括:获取模块,用于获取输入的语音信号,并对所述语音信号进行预处理,得到所述语音信号的目标语音参数;第一识别模块,用于利用脉冲神经网络模型对所述目标语音参数进行第一识别,得到最优识别序列;第二识别模块,用于利用圆映射方法对所述最优识别序列进行第二识别,得到所述语音信号的识别结果。本专利技术的实施例还提供了一种语音识别设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的语音识别方法的步骤。本专利技术的实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的语音识别方法的步骤。本专利技术的上述方案至少有如下的有益效果:在本专利技术的实施例中,在获取到输入的语音信号后,通过对该语音信号进行预处理得到该语音信号的目标语音参数,并利用脉冲神经网络模型对目标语音参数进行第一识别,得到最优识别序列,最终利用圆映射方法对最优识别序列进行第二识别,得到语音信号的识别结果,其中由于采用脉冲神经网络模型和圆映射的方法结合对所输入的语音信号进行识别,从而提高了语音识别速率,优化了网络结构,同时提高了识别的精确度,解决了单一的神经网络带来的局限性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。图1是本专利技术实施例中语音识别方法的流程图;图2是本专利技术实施例中语音识别装置的结构示意图;图3是本专利技术实施例中语音识别设备的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示,本专利技术的实施例提供了一种语音识别方法,该方法包括:步骤11,获取输入的语音信号,并对所述语音信号进行预处理,得到所述语音信号的目标语音参数。其中,在本专利技术的实施例中,可具体通过一矩阵麦克风获取用户输入的语音信号,当然也可通过其他拾音设备获取用户用户输入的语音信号。需要说明的是,在获取到用户输入的语音信号后,需要对该语音信号进行去噪、转换为数字信号、预加重、加窗分帧、端点检测等预处理操作,以获得语音信号的目标语音参数。具体的,在本专利技术的实施例中,上述步骤11中对所述语音信号进行预处理,得到所述语音信号的目标语音参数的具体实现方式包括如下步骤:步骤一,对所述语音信号进行去噪处理,以得到无噪声的语音信号,保证输入的语音信号中的干扰噪声不影响语音识别的结果。需要说明的是,对语音进行去噪的处理过程可以采用目前常用的去噪方式实现。步骤二,将去噪处理后的语音信号转换为语音数字信号,并对语音数字信号进行预加重处理,以对语音数字信号的高频部分进行加重,去除口唇辐射的影响,增加语音数字信号的高频分辨率。在本专利技术的实施例中,可通过传递函数为H(z)=1-az-1的高通数字滤波器实现预加重。其中H(z)表示传递函数,a为预加重系数(该预加重系数的大小可以根据高频信号强度的大小确定),z指的是输入至高通数字滤波器的语音数字信号,对语音数字信号进行预加本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,包括:/n获取输入的语音信号,并对所述语音信号进行预处理,得到所述语音信号的目标语音参数;/n利用脉冲神经网络模型对所述目标语音参数进行第一识别,得到最优识别序列;/n利用圆映射方法对所述最优识别序列进行第二识别,得到所述语音信号的识别结果。/n

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:
获取输入的语音信号,并对所述语音信号进行预处理,得到所述语音信号的目标语音参数;
利用脉冲神经网络模型对所述目标语音参数进行第一识别,得到最优识别序列;
利用圆映射方法对所述最优识别序列进行第二识别,得到所述语音信号的识别结果。


2.根据权利要求1所述的方法,其特征在于,所述对所述语音信号进行预处理,得到所述语音信号的目标语音参数的步骤,包括:
对所述语音信号进行去噪处理;
将去噪处理后的语音信号转换为语音数字信号,并对语音数字信号进行预加重处理;
对预加重处理后的语音数字信号进行加窗分帧处理,得到多帧预加重语音数字信号;
通过对每帧预加重语音数字信号进行端点检测,确定每帧预加重语音数字信号的起止点;
提取每帧预加重语音数字信号的语音信号特征参数,并将提取到的语音信号特征参数作为所述语音信号的目标语音参数。


3.根据权利要求2所述的方法,其特征在于,每帧预加重语音数字信号的语音信号特征参数包括:预加重语音数字信号的语音信号幅度、预加重语音数字信号的信号过零率、预加重语音数字信号的信号基音频率、预加重语音数字信号的信号线性预测的系数、预加重语音数字信号的信号线性预测倒谱系数。


4.根据权利要求1所述的方法,其特征在于,所述利用脉冲神经网络模型对所述目标语音参数进行第一识别,得到最优识别序列的步骤,包括:
将所述目标语音参数作为H-H脉冲神经网络模型的输入电流;
通过所述H-H脉冲神经网络模型对所述目标语音参数进行识别,得到最优识别序列。


5.根据权利要求1所述的方法,其特征在于,所述利用圆映射方法对所述最优识别序列进行第二识别,得到所述语音信号的识别结果...

【专利技术属性】
技术研发人员:马蛟龙
申请(专利权)人:甘肃龙科智能科技有限公司
类型:发明
国别省市:甘肃;62

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1