一种语音指令识别方法、装置及计算机存储介质制造方法及图纸

技术编号:19829037 阅读:12 留言:0更新日期:2018-12-19 17:04
一种语音指令识别方法、装置及计算机存储介质,所述语音指令识别方法包括:对语音信号进行预处理得到有效语音信号;提取有效语音信号的语音信号特征;根据语音信号特征识别有效语音信号中的语音指令。本发明专利技术实施例通过对语音信号的预处理以及语音信号特征的提取实现了对语音指令的识别。

【技术实现步骤摘要】
一种语音指令识别方法、装置及计算机存储介质
本文涉及但不限于计算机技术,尤指一种语音指令识别方法、装置及计算机存储介质。
技术介绍
随着声音信号处理技术的发展,集成降噪算法的声音处理技术已经明显地改善了耳机的声音品质和聆听效果。例如,应用于作战环境的头戴式耳机耳罩降低了作战过程中的枪声、炮声等大量有伤听力的高分贝噪音,能有效地保护战场上士兵的听力,提高军队的作战警惕性和整体作战实力。降噪听力防护耳罩也在空军运输机、空军地勤等领域投入使用,为处于高噪音环境中的士兵提供最完善的听力防护,大大降低了战场上的高分贝噪音和巨大爆炸声等对他们造成的伤害,提高作战指令信息的精准快速传达。随着作战环境的日益复杂,信息技术、通信技术和自动化技术的快速发展,为适应新一代作战设备的需求,作战防护耳机不能进停留在降噪和声效处理上,如何设计实现新功能的更实用的作战防护耳罩成为了新兴的课题。
技术实现思路
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。本专利技术实施例提供一种语音指令识别方法、装置及计算机存储介质,能够识别语言指令。本专利技术实施例提供了一种语音指令识别方法,包括:对语音信号进行预处理得到有效语音信号;提取有效语音信号的语音信号特征参数;根据语音信号特征参数识别有效语音信号中的语音指令。可选的,所述对语音信号进行预处理得到有效语音信号包括:对所述语音信号进行端点检测,以获得所述有效语音信号。可选的,所述对所述语音信号进行端点检测包括:根据短时能量和短时过零率对所述语音信号进行端点检测。可选的,所述语音信号特征参数包括以下部分或全部参数:线性预测系数LPC、线性预测倒谱系数LPCC、梅尔倒谱系数MFCC、差分梅尔倒谱系数。可选的,所述根据语音信号特征参数识别有效语音信号中的语音指令包括:通过粒子群算法对概率神经网络模型的平滑因子进行处理;基于平滑因子处理过的概率神经网络模型,对所述根据语音信号特征参数识别有效语音信号进行训练,识别所述有效语音信号中的语音指令。另一方面,本专利技术实施例还提供一种语音指令识别装置,包括:预处理模块,用于对语音信号进行预处理得到有效语音信号;提取模块,用于提取有效语音信号的语音信号特征参数;识别模块,用于根据语音信号特征参数识别有效语音信号中的语音指令。可选的,所述预处理模块具体用于根据短时能量和短时过零率对所述语音信号进行端点检测,以获得所述有效语音信号。可选的,所述识别模块具体用于:通过粒子群算法对概率神经网络模型的平滑因子进行处理;基于平滑因子处理过的概率神经网络模型,对所述根据语音信号特征参数识别有效语音信号进行训练,识别所述有效语音信号中的语音指令。再一方面,本专利技术实施例还提供一种语音指令识别装置,包括处理器和计算机可读存储介质,所述计算机可读存储介质中存储有指令,其特征在于,当所述指令被所述处理器执行时,实现如权利要求1~5任一项所述的语音指令识别方法。还一方面,本专利技术实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述语音指令识别方法的步骤。与相关技术相比,本专利技术实施例包括:对语音信号进行预处理得到有效语音信号;提取有效语音信号的语音信号特征;根据语音信号特征识别有效语音信号中的语音指令。本专利技术实施例通过对语音信号的预处理以及语音信号特征的提取实现了对语音指令的识别。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。附图说明附图用来提供对本专利技术技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本专利技术的技术方案,并不构成对本专利技术技术方案的限制。图1为本专利技术一个实施例提出的语音指令识别方法的流程图;图2为本专利技术实施例概率神经网络的组成示意图;图3为本专利技术一个实施例提出的语音指令识别装置的结构框图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,下文中将结合附图对本专利技术的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。参见图1,本专利技术一个实施例提出了一种语音指令识别方法,包括:步骤100、对语音信号进行预处理得到有效语音信号。可选的,本专利技术实施例,对语音信号进行预处理得到有效语音信号包括:对所述语音信号进行端点检测,以获得所述有效语音信号。可选的,本专利技术实施例对语音信号进行预处理还包括:对语音信号进行分帧加窗处理。可选的,本专利技术实施例对所述语音信号进行端点检测包括:根据短时能量和短时过零率对所述语音信号进行端点检测。本专利技术实施例,对语音信号进行的预处理包括:基于能量的端点检测,在一段语音信号中,语音信号的开始点并不一定是有效语音信号的起始点,有语音信号的存在也不一定是有效语音信号,对于这样的语音信号,如果直接进行语音信号特征的提取,会为后续的语音指令的识别增加难度,因此必须进行端点检测。参照相关技术,有效语音信号和噪声信号的主要区别在能量上,有效语音信号的能量比噪声信号的能量大,语音信号的能量是噪声信号的能量和有效语音信号的能量之和;本专利技术实施例中应用了基于能量的端点检测方法,就是在短时能量检测方法的基础上,加上短时平均过零率,利用短时能量和短时过零率作为特征来进行检测;当语音信号的任一帧的特征值小于预设的特征阈值时,本专利技术实施例确定当前语音信号为静音信号;当语音信号的所有帧的特征值均大于或等于所述特征阈值时,确定当前语音信号为有效语音信号。步骤101、提取有效语音信号的语音信号特征参数。可选的,本专利技术实施例,语音信号特征参数可以包括以下一种或一种以上参数:线性预测系数(LPC,LinearPredictionCoefficient)、线性预测倒谱系数(LPCC,LinearPredictionCepstrumCoefficient)、梅尔倒谱系数(MFCC,MelFrequencyCepstrumCoefficient)、差分梅尔倒谱系数。步骤102、根据语音信号特征参数识别有效语音信号中的语音指令。本专利技术实施例,应用概率神经网络(PNN,ProbabilisticNeuralNetwork)作为主要的分类器进行语音指令的识别,概率神经网络是在径向基神经网络的基础上,融合了密度函数估计和贝叶斯决策理论的一种新的人工神经网络。图2为本专利技术实施例概率神经网络的组成示意图,如图2所示,概率神经网络由输入层、隐层、求和层和输出层组成;其中,隐层也称为模式层或样本层,其神经元数目与训练样本集合的大小一致,即每个神经元表征一个样本。该层计算输入样本h与训练集中每个训练样本X的欧式距离,计算欧式距离的方法为本领域技术人员的公知常识,在此不做赘述;求和层将隐层中属于同一类的隐含神经元的输出做加权平均;输出层通过径向基函数对求和层加权平均进行非线性映射(即公式(1))获得输出量,即获得初始概率矩阵M:需要说明的是,本文档来自技高网...

【技术保护点】
1.一种语音指令识别方法,包括:对语音信号进行预处理得到有效语音信号;提取有效语音信号的语音信号特征参数;根据语音信号特征参数识别有效语音信号中的语音指令。

【技术特征摘要】
1.一种语音指令识别方法,包括:对语音信号进行预处理得到有效语音信号;提取有效语音信号的语音信号特征参数;根据语音信号特征参数识别有效语音信号中的语音指令。2.根据权利要求1所述的语音指令识别方法,其特征在于,所述对语音信号进行预处理得到有效语音信号包括:对所述语音信号进行端点检测,以获得所述有效语音信号。3.根据权利要求2所述的语音指令识别方法,其特征在于,所述对所述语音信号进行端点检测包括:根据短时能量和短时过零率对所述语音信号进行端点检测。4.根据权利要求1所述的语音指令识别方法,其特征在于,所述语音信号特征参数包括以下部分或全部参数:线性预测系数LPC、线性预测倒谱系数LPCC、梅尔倒谱系数MFCC、差分梅尔倒谱系数。5.根据权利要求1~4任一项所述的语音指令识别方法,其特征在于,所述根据语音信号特征参数识别有效语音信号中的语音指令包括:通过粒子群算法对概率神经网络模型的平滑因子进行处理;基于平滑因子处理过的概率神经网络模型,对所述根据语音信号特征参数识别有效语音信号进行训练,识别所述有效语音信号中的语音指令。6....

【专利技术属性】
技术研发人员:凌茵田国光
申请(专利权)人:北京旋极信息技术股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1