一种语音信息识别方法和解码器技术

技术编号:12138956 阅读:83 留言:0更新日期:2015-10-01 17:32
本发明专利技术公开了一种语音信息识别方法和解码器,属于语音识别领域,包括:获取根据语音信息生成的输入数据;判断根据输入数据识别生成的输出数据是否有效;若输出数据无效,则设置输出数据为零;若输出数据有效,将输出数据输出至当前层模型单元的下一层模型单元。通过判断根据输入数据识别生成的输出数据是否有效,实现了对语音信息识别过程中对无效输出的识别,相比于传统的语音信息识别,提高了语音信息识别的速度,从而提高了语音识别的效率;同时,通过设置无效的输出数据为零,使得该在对语音信息识别过程中对无效输出不进行处理,从而进一步提高了语音信息识别的速度,从而提高了语音识别的效率。

【技术实现步骤摘要】

本专利技术涉及语音识别领域,特别涉及一种语音信息识别方法和解码器
技术介绍
在语音识别过程中,语音识别的准确率和速度是识别效率的两大重要指标,随着语音识别技术的普及,对语音识别的识别效率要求越来越高,使得需要一种语音信息识别方法,提高语音识别的效率。现有技术提供了一种语音信息识别方法,通过语音信息输入包括多个模型单元的多层神经网络,对所有模型单元的输出数据进行处理,生成识别结果,从而实现语音信息的识别,提高了语音识别的准确率。但是在使用现有技术提供的方法时,由于是对多层神经网络中所有模型单元的输出数据进行处理,从而降低了语音信息识别的速度,降低了语音识别的效率。
技术实现思路
为了提高语音信息识别的速度,提高语音识别的效率,本专利技术实施例提供了一种语音信息识别方法和解码器。所述技术方案如下:第一方面,提供了一种语音信息识别方法,所述方法包括:获取根据语音信息生成的输入数据;判断根据所述输入数据识别生成的输出数据是否有效;若所述输出数据无效,则设置所述输出数据为零,若所述输出数据有效,则将所述输出数据输出至当前层模型单元的下一层模型单元。第二方面,提供了一种语音信息解码器,所述语音信息解码器包括:至少一层模型单元和控制模块,其中,所述控制模块包括:获取子模块,用于获取根据语音信息生成的输入数据;判决子模块,用于判断根据所述输入数据识别生成的输出数据是否有效;设置子模块,用于在判定所述输出数据无效时,设置所述输出数据为零;输出子模块,用于在判定所述输出数据有效时,将所述输出数据输出至当前层模型单元的下一层模型单元。第三方面,提供了一种电子设备,所述电子设备包括麦克风、存储器以及与所述麦克风、所述存储器连接的处理器,其中,所述存储器用于存储一组程序代码,所述处理器调用所述存储器所述存储的程序代码用于执行以下操作:获取根据语音信息生成的输入数据;判断根据所述输入数据识别生成的输出数据是否有效;若所述输出数据无效,则设置所述输出数据为零,若所述输出数据有效,则将所述输出数据输出至当前层模型单元的下一层模型单元。本专利技术实施例提供了一种语音信息识别方法和解码器,包括:获取根据语音信息生成的输入数据;判断根据输入数据识别生成的输出数据是否有效;若输出数据无效,则设置输出数据为零;若输出数据有效,将输出数据输出至当前层模型单元的下一层模型单元。由于传统的语音信息识别方法无法识别无效输出,而本专利技术提供的方法通过判断根据输入数据识别生成的输出数据是否有效,实现了对语音信息识别过程中对无效输出的识另IJ,相比于传统的语音信息识别,提高了语音信息识别的速度,从而提高了语音识别的效率;同时,通过设置无效的输出数据为零,使得该在对语音信息识别过程中对无效输出不进行处理,从而进一步提高了语音信息识别的速度,从而提高了语音识别的效率。【附图说明】为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种语音信息识别方法流程图;图2是本专利技术实施例提供的一种解码器结构示意图;图3是本专利技术实施例提供的一种语音信息识别方法流程图;图4是本专利技术实施例提供的一种解码器结构示意图;图5是本专利技术实施例提供的一种电子设备结构示意图。【具体实施方式】为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一为本专利技术实施例提供的一种语音信息识别方法,参照图1所示,该方法包括:101、获取根据语音信息生成的输入数据。可选的,还可以包括:当前层模型单元包括至少一个节点,方法还包括:设置至少一个节点的阈值。102、判断根据输入数据识别生成的输出数据是否有效,若输出数据无效,则执行步骤103,若输出数据有效,则执行步骤104。具体的,根据输入数据,生成与至少一个节点分别对应的至少一个输出数据;判断与节点对应的输出数据是否大于或者等于与节点对应的阈值,若是,则判定节点对应的输出数据有效,否则,则判定节点对应的输出数据无效。103、设置输出数据为零。104、将输出数据输出至当前层模型单元的下一层模型单元。具体的,将至少一个输出数据中所有有效的输出数据输出至下一层模型单元。可选的,在将输出数据输出至当前层模型单元的下一层模型单元之前,还包括:判断下一层模型单元是否为最后一层模型单元,若是,则输出输出数据;否则,继续执行将输出数据输出至当前层模型单元的下一层模型单元的步骤。本专利技术实施例提供了一种语音信息识别方法,由于传统的语音信息识别方法无法识别无效输出,而本专利技术提供的方法通过判断根据输入数据识别生成的输出数据是否有效,实现了对语音信息识别过程中对无效输出的识别,相比于传统的语音信息识别,提高了语音信息识别的速度,从而提高了语音识别的效率;同时,通过设置无效的输出数据为零,使得该在对语音信息识别过程中对无效输出不进行处理,从而进一步提高了语音信息识别的速度,从而提高了语音识别的效率。实施例二为本专利技术实施例提供的一种语音信息识别方法,该方法应用于一种编码器,该编码器至少包括N层模型单元,该N层模型单元之间设置有连接权重,参照图2所示,在图2中,假设当前层模型单元为第X层模型单元,当前模型单元的下一层模型单元为第X+1层模型单元,该第X层模型单元包括两个节点,分别为第一节点和第二节点,该第一节点的阈值为第一阈值,该第二节点的阈值为第二阈值。在本专利技术实施例中,语音信息为根据用户的语音片段进行编码后生成的信息,该语音信息至少包括声纹特征参数,该声纹特征参数可以为LPCC (Linear Predict1n Cepstrum Coeff icient,线性预测倒谱系数)、MFCC(Mel Frequnce Cepstrum Coefficient,美尔频率倒谱系数)和 PLPC(PerceptualLinear Predictive Coefficient,感知线性预测系数)中的任意一个,在实际应用中,该声纹特征参数可以为MFCC。参照图3所示,该方法包括:301、获取根据语音信息生成的输入数据。具体的,若该第X层模型单元为N层模型单元中的第一层模型单元,则该输入数据为语音数据,获取根据语音信息生成的输入数据的过程可以为:接收该语音信息。若该第X层模型单元为N层模型单元中的第一层模型单元之后的任意一层模型单元,则该输入数据为第X-1层模型单元的输出数据,,该输入数据包括声纹特当前第1页1 2 3 本文档来自技高网...

【技术保护点】
一种语音信息识别方法,其特征在于,所述方法包括:获取根据语音信息生成的输入数据;判断根据所述输入数据识别生成的输出数据是否有效;若所述输出数据无效,则设置所述输出数据为零,若所述输出数据有效,则将所述输出数据输出至当前层模型单元的下一层模型单元。

【技术特征摘要】

【专利技术属性】
技术研发人员:赵峰王力劭
申请(专利权)人:深圳市车音网科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1