一种基于BP神经网络的本地语音识别方法技术

技术编号:9569702 阅读:141 留言:0更新日期:2014-01-16 03:02
本发明专利技术公开了一种基于BP神经网络的本地语音识别方法,步骤如下:(1)用户输入语音,建立操作和语音的命令集映射对,得到BP神经网络模型;(2)用户输入语音,用户输入的语音特征参数值经过BP神经网络进行正向传播,将神经网络实际输出值与所有的期望值进行比较;若有一个误差值小于预先设定的误差值,进入步骤(3);若所有的误差值均大于预先设定的误差值X,则进入步骤(4);(3)得到神经网络输出应用程序包名,启动应用程序;(4)误差值反向传播,作为BP神经网络输入,修正权值;直到有一个误差值小于X为止;若终止条件后,还未有误差值小于X,则结束训练。本发明专利技术具有数据库存储量需求少、语音识别速度快及精度高的优点。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种基于BP神经网络的本地语音识别方法,步骤如下:(1)用户输入语音,建立操作和语音的命令集映射对,得到BP神经网络模型;(2)用户输入语音,用户输入的语音特征参数值经过BP神经网络进行正向传播,将神经网络实际输出值与所有的期望值进行比较;若有一个误差值小于预先设定的误差值,进入步骤(3);若所有的误差值均大于预先设定的误差值X,则进入步骤(4);(3)得到神经网络输出应用程序包名,启动应用程序;(4)误差值反向传播,作为BP神经网络输入,修正权值;直到有一个误差值小于X为止;若终止条件后,还未有误差值小于X,则结束训练。本专利技术具有数据库存储量需求少、语音识别速度快及精度高的优点。【专利说明】一种基于BP神经网络的本地语音识别方法
本专利技术涉及一种语音识别方法,特别涉及一种基于BP神经网络的本地语音识别方法。
技术介绍
语音识别是机器通过识别和理解过程把人类的语音信号转变成相应的文本或命令的技术,其根本目的是研究出一种具有听觉功能的机器,这种机器能直接接受人的语音,理解人的意图,并做出相应的反应。语音识别作为人机交互的一项关键领域,具备了实时,方便,快速等特点,在当今科学技术的发展上也有着日益重要的地位。其中人工神经网络在语音识别中的应用已经成为目前语音识别的主流方法;但是现有终端的语音识别都是将设定好的数据库作为神经网络的原始训练集,在训练集中预设定的是一些比较规范的“参考语音”,在识别过程中,将用户的语音与规范的“参考语音”进行比较,由于每个人说同一句话的语音、语速等不同,因此原始训练集中必须要存放更多的训练样本,识别速度慢、精度低,而且需要大存储量的数据库进行原始训练集的存放。另外,现有终端的语音识别基本通过以下两种方式实现:一、数据库存放在网络端,这种情况下,当没有网络时,将直接无法使用语音识别方法。二、数据库存在本地,当要求终端能够识别多种语言和方言时,势必会造成数据库存储容量需求过大。
技术实现思路
本专利技术的目的在于克服现有技术的缺点与不足,提供一种数据库存储量需求少、语音识别速度快及精度高的基于BP神经网络的本地语音识别方法。本专利技术的目的通过下述技术方案实现:一种基于BP神经网络的本地语音识别方法,具体步骤如下:(I)用户针对系统中的各操作,分别在系统中输入相应的语音,通过系统建立操作和语音的命令集映射对,作为BP神经网络的原始训练集,对BP神经网络进行训练,所述语音为用户输入的原始语音信息,系统对其进行预处理及特征参数提取,将提取的特征参数值输入到BP神经网络的输入端,所述操作为系统执行的应用程序,所述操作对应的应用程序包名为BP神经网络的输出;(2)BP神经网络的训练完后,用户向系统输入语音数据,系统首先对用户输入的语音数据进行预处理及提取语音的特征参数值,语音的特征参数值经过BP神经网络进行传播,将神经网络实际输出值与所有的期望值进行比较;若有其中一个误差值小于预先设定的误差值,则将该误差对应的输出作为语音识别的最终输出;然后进入步骤(3);若所有的误差值均大于预先设定的误差值,则进入步骤(4);(3)系统识别BP神经网络输出的应用程序的包名,调用包名相应的应用程序,执行应用程序相应的操作;(4)将所有的误差值在BP神经网络中反向传播,作为BP神经网络的输入,从而修正各个节点单元的权值;若当前学习次数小于预先设定的学习次数,则继续传播,直到其中一个误差值小于预先设定的误差值为止;若当前学习次数大于预先设定的学习次数时,还未出现一个误差值小于预先设定的误差值,则结束训练,并且由系统作出无法找到应用程序的提示。优选的,所述步骤(I)中,操作和语音命令集映射对中操作的应用程序包名存放在系统的ArrayList中;ArrayList中包名的个数和BP神经网络输出层的输出维数相同。优选的,所述步骤(I)和步骤(2)中语音的特征参数值的个数为6,所述BP神经网络的输入层的输入维数和语音的特征参数值的个数相同;所述语音的特征参数为能量、幅度、过零率、频谱、倒谱和功率谱。优选的,所述步骤(I)和步骤(2)中语音的预处理包括对语音依次进行预加重、力口窗分帧和端点检测处理。优选的,所述操作和语音的命令集映射对中,包含有多个语音映射同一个操作的情况。优选的,所述步骤(2)中,预先设定的误差值为0.000001。优选的,所述步骤(3)中预先设定的学习次数为1000。优选的,系统在建立操作和语音的命令集映射对过程中,用户根据操作的作用输入相应的语音。本专利技术相对于现有技术具有如下的优点及效果:(I)本专利技术中根据用户自身建立的操作和语音命令集映射对实现BP神经网络的训练,本专利技术中通过终端系统本地的操作和语音命令集映射对代替传统语音识别方法中数据库中的训练数据,在极大程度上节省了终端的训练集存储容量。(2)本专利技术在神经网络原始数据训练的过程,即操作和语音命令集映射对创建的过程中,将用户输入的语音作为原始训练集的,因此本专利技术在语音识别过程中,是将用户自己的语音作为参考值,在识别过程中和用户输入的语音进行对比的,这种将自己的语音作为参考比较对象,在语音识别过程中,由于用户输入的因为与当初的初始训练集相似多会很高,所以神经网络的输出误差很小,使得本专利技术方法语音识别的速度更快、准确度更高。(3)本专利技术用户自行创建的操作和语音命令集映射对,自即用户自行创建原始训练集,不受任何语言的限制,可以使用用户自己的方言对BP神经网络进行训练,因此不受任何语言的限制,可以使用用户自己的方言对BP神经网络进行训练,因此非常适合各个不同方言地方及普通话不标准的人使用。而传统的终端如果数据库存放在本地,由于数据库容量的限制,只能识别有限数量的语音,否则会导致数据库暴大。(4)本专利技术方法的操作和语音命令集映射对中,一个操作可以映射多个语音,因此本专利技术中用户可以通过多种语音控制同一个操作,使得用户在使用时更加方便。(5)本专利技术中的原始训练集可以通过由用户在创新操作和语音映射对时进行自行改变,用户可以通过语音输入功能随时在系统中就加入每个操作所对应的新的语音词汇。【专利附图】【附图说明】图1是本专利技术方法流程图。图2是本专利技术方法中终端的语音输入和语音识别功能选择界面。图3是本专利技术方法中电机语音输入按钮后所出现的界面。图4是本专利技术方法中终端的应用程序选择界面。图5是本专利技术方法中终端的语音输入时的界面。【具体实施方式】下面结合实施例及附图对本专利技术作进一步详细的描述,但本专利技术的实施方式不限于此。实施例本实施例公开了一种基于BP神经网络的本地语音识别方法,具体步骤如下:(I)用户针对系统的各操作的作用,分别在系统中输入各操作对应的语音,通过系统建立操作和语音的命令集映射对,作为BP神经网络的原始训练集,对BP神经网络进行训练,语音为用户输入的原始语音信息,系统对其进行预处理及特征参数提取,将提取特征参数值输入到BP神经网络的输入端,所述操作为系统执行的应用程序,所述操作对应的应用程序包名为BP神经网络的输出;其中命令集映射对中的操作的应用程序包名存放在ArrayList中。在操作和语音的命令集映射对创建过程中,可以为同一个操作创建多个语音。即在操作和语音的命令集映射对中,同一个操作可以映射有多个语音。其中本实施例本文档来自技高网
...
一种基于BP神经网络的本地语音识别方法

【技术保护点】
一种基于BP神经网络的本地语音识别方法,其特征在于,具体步骤如下:(1)用户针对系统中的各操作,分别在系统中输入相应的语音,通过系统建立操作和语音的命令集映射对,作为BP神经网络的原始训练集,对BP神经网络进行训练,所述语音为用户输入的原始语音信息,系统对其进行预处理及特征参数提取,将提取的特征参数值输入到BP神经网络的输入端,所述操作为系统执行的应用程序,所述操作对应的应用程序包名为BP神经网络的输出;(2)BP神经网络的训练完后,用户向系统输入语音数据,系统首先对用户输入的语音数据进行预处理及提取语音的特征参数值,语音的特征参数值经过BP神经网络进行传播,将神经网络实际输出值与所有的期望值进行比较;若有其中一个误差值小于预先设定的误差值,则将该误差对应的输出作为语音识别的最终输出;然后进入步骤(3);若所有的误差值均大于预先设定的误差值,则进入步骤(4);(3)系统识别BP神经网络输出的应用程序的包名,调用包名相应的应用程序,执行应用程序相应的操作;(4)将所有的误差值在BP神经网络中反向传播,作为BP神经网络的输入,从而修正各个节点单元的权值;若当前学习次数小于预先设定的学习次数,则继续传播,直到其中一个误差值小于预先设定的误差值为止;若当前学习次数大于预先设定的学习次数时,还未出现一个误差值小于预先设定的误差值,则结束训练,并且由系统作出无法找到应用程序的提示。...

【技术特征摘要】

【专利技术属性】
技术研发人员:孙建华
申请(专利权)人:广东欧珀移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1