基于人工神经网络的语音识别方法、装置及电子设备制造方法及图纸

技术编号:15259853 阅读:227 留言:0更新日期:2017-05-03 12:29
一种基于人工神经网络的语音识别方法、装置及电子设备,基于人工神经网络的语音识别方法包括:离线训练用于语音识别的人工神经网络模型;在离线训练的人工神经网络模型通过测试后,记录人工神经网络模型的当前权重和当前偏置值;将当前权重和当前偏置值作为无线终端采用的人工神经网络模型的初始权重和初始偏置值;在线训练采用初始权重和初始偏置值的人工神经网络模型,得到在线训练后的权重和偏置值;将采用在线训练后的权重和偏置值的人工神经网络模型用于无线终端的语音识别。所述基于人工神经网络的语音识别方法、装置及电子设备缩短了无线终端采用的人工神经网络模型的训练时间,提高了语音识别输出结果的准确性。

Speech recognition method based on artificial neural network, device and electronic equipment

A speech recognition method based on artificial neural network, device and electronic equipment, including speech recognition method based on artificial neural network: off-line training neural network model for speech recognition; artificial neural network model in the offline training after passing the test, record the artificial neural network model of the current and the current value of the weight bias; the weight and bias current value of the artificial neural network model as the wireless terminal uses the initial weights and initial bias values; online training using artificial neural network model and the initial value of the initial weight bias, get online training weight and bias values; the artificial neural network model for online training after the weight and bias values speech recognition for wireless terminal. The speech recognition method based on the artificial neural network, the device and the electronic equipment shorten the training time of the artificial neural network model used by the wireless terminal, and improve the accuracy of the output result of the speech recognition.

【技术实现步骤摘要】

本专利技术涉及智能通信领域,尤其涉及一种基于人工神经网络的语音识别方法、装置及电子设备
技术介绍
随着智能终端行业的快速发展,智能终端上能够实现的功能越来越多,其中,语音控制是在智能终端上非常流行的一种功能。如何准确快速的识别每个语音命令是语音控制的重要部分。现有技术中,通常使用人工神经网络(NeuralNetworkAlgorithm,ANN)方法对语音控制命令进行分类识别。人工神经网络模型由大量的节点(或神经元)之间相互联接构成。每个节点代表一种特定的输出函数,为激励函数。两个节点之间的连接代表一个对于通过该连接信号的加权值,称之为权重,相当于人工神经网络的记忆。人工神经网络模型的输出根据网络的连接方式、权重值和激励函数的不同而不同。语音控制命令中的音频数据中包含元音和辅音,人工神经网络方法通过识别出元音和辅音并进行分类,然后再利用元音和辅音的分类结果的组合和顺序按照一定的规则判定语音数据命令。权重和隐藏神经元的偏置是影响人工神经网络模型性能的重要参数,通过提取的语音数据来训练人工神经网络模型,得到有效的权重和偏置。但是,现有技术的语音识别方法中,通常人工神经网络模型的初始权重是由随机数初始化,初始偏置值由零初始化,由于权重和偏置值的初始化方式,导致语音识别的分类输出结果不准确,同时需要相当长的时间来进行训练人工神经网络模型。
技术实现思路
本专利技术解决的技术问题是如何缩短用于语音识别的人工神经网络模型的训练时间,提高输出结果的准确性。为解决上述技术问题,本专利技术实施例提供一种基于人工神经网络的语音识别方法,所述基于人工神经网络的语音识别方法包括:离线训练用于语音识别的人工神经网络模型;在离线训练的所述人工神经网络模型通过测试后,记录所述人工神经网络模型的当前权重和当前偏置值;将所述当前权重和所述当前偏置值作为无线终端采用的所述人工神经网络模型的初始权重和初始偏置值;在线训练采用所述初始权重和所述初始偏置值的所述人工神经网络模型,得到在线训练后的权重和偏置值;将采用所述在线训练后的权重和偏置值的所述人工神经网络模型用于所述无线终端的语音识别。可选的,所述离线训练用于语音识别的人工神经网络模型包括:获取目标语音数据和干扰语音数据,形成第一训练数据集;将所述人工神经网络模型的权重随机初始化,偏置值从零初始化;根据所述第一训练数据集训练所述人工神经网络模型。可选的,所述离线训练的所述人工神经网络模型通过测试包括:将测试语音数据输入至离线训练后的所述人工神经网络模型,并将所述人工神经网络模型的输出与所述测试语音数据进行比较,得到输出错误率;当所述输出错误率达到设定阈值时,记录所述人工神经网络模型的当前权重和当前偏置值。可选的,所述输出错误率没有达到设定阈值时,将所述人工神经网络模型的所述权重随机初始化,所述偏置值从零初始化。可选的,所述在线训练采用所述初始权重和所述初始偏置值的所述人工神经网络模型包括:获取终端记录的语音数据,形成第二训练数据集;根据所述第二训练数据集训练采用所述初始权重和所述初始偏置值的所述人工神经网络模型。可选的,将在线训练后的所述人工神经网络模型的输出转换为可供电子设备执行的操作指令。可选的,所述第一训练数据集包括具备不同语速、语调或分贝的所述目标语音数据或所述干扰语音数据;所述第二训练数据集包括具备不同语速、语调或分贝的所述语音数据。为解决上述技术问题,本专利技术实施例还公开了一种基于人工神经网络的语音识别装置,基于人工神经网络的语音识别装置包括:初始单元,适于将记录的初始权重和初始偏置值用于人工神经网络模型;所述初始权重和所述初始偏置值是通过离线训练所述人工神经网络模型得到。在线训练单元,耦接所述初始单元,在线训练采用所述初始权重和所述初始偏置值的人工神经网络模型,得到在线训练后的权重和偏置值;语音识别单元,将采用所述在线训练后的权重和偏置值的所述人工神经网络模型用于无线终端的语音识别。可选的,所述基于人工神经网络的语音识别装置还包括:语音转换单元,将在线训练后的所述人工神经网络模型的输出转换为可供电子设备执行的操作指令。为解决上述技术问题,本专利技术实施例还公开了一种电子设备所述电子设备包括基于人工神经网络的语音识别装置。与现有技术相比,本专利技术实施例的技术方案具有以下有益效果:本专利技术实施例通过离线训练用于语音识别的人工神经网络模型,在离线训练的所述人工神经网络模型通过测试后,记录所述人工神经网络模型的当前权重和当前偏置值;将所述当前权重和所述当前偏置值作为无线终端采用的所述人工神经网络模型的初始权重和初始偏置值;在线训练采用所述初始权重和所述初始偏置值的所述人工神经网络模型,得到在线训练后的权重和偏置值;将采用所述在线训练后的权重和偏置值的所述人工神经网络模型用于所述无线终端的语音识别;通过离线训练人工神经网络模型得到初始权重和初始偏置值,用于无线终端采用的人工神经网络模型,缩短了无线终端采用的人工神经网络模型的训练时间,提高了语音识别输出结果的准确性。附图说明图1是本专利技术实施例一种人工神经网络模型结构示意图;图2是本专利技术实施例一种基于人工神经网络的语音识别方法流程图;图3是本专利技术实施例一种离线训练人工神经网络的方法流程图;图4是本专利技术实施例一种在线训练人工神经网络的方法流程图;图5是本专利技术实施例一种基于人工神经网络的语音识别装置结构示意图。具体实施方式如
技术介绍
中所述,现有技术的语音识别方法中,通常人工神经网络模型权重是由随机数初始化,偏置由零初始化,由于权重和偏置的初始化方式,导致语音识别的分类输出结果不准确,同时需要相当长的时间来进行训练人工神经网络模型。本专利技术实施例通过离线训练用于语音识别的人工神经网络模型,在离线训练的所述人工神经网络模型通过测试后,记录所述人工神经网络模型的当前权重和当前偏置值;将所述当前权重和所述当前偏置值作为无线终端采用的所述人工神经网络模型的初始权重和初始偏置值;在线训练采用所述初始权重和所述初始偏置值的所述人工神经网络模型,得到在线训练后的权重和偏置值;将采用所述在线训练后的权重和偏置值的所述人工神经网络模型用于所述无线终端的语音识别;通过离线训练人工神经网络模型得到初始权重和初始偏置值,用于无线终端采用的人工神经网络模型,缩短了无线终端采用的人工神经网络模型的训练时间,提高了语音识别输出结果的准确性。为使本专利技术的上述目的、特征和优点能够更为明显易懂,下面结合附图对本专利技术的具体实施例做详细的说明。图1是本专利技术实施例一种人工神经网络模型结构示意图。请参照图1,人工神经网络结构包括输入层、隐藏层和输出层。本实施例中,输入层包括,X1,X2…Xi表示输入的数据;输出层包括,Y1,Y2....Yj表示输出数据;输入层和隐藏层存在多重连接方式,每种连接方式对应一个连接权系数,即权重W11,W1j,W21,…Wij;b1…bj表示隐藏层的偏置。本实施例中,人工神经网络由神经元模型构成,神经元模型并行分布形成信息处理网络。每个神经元具有单一输出,并且能够与其它神经元连接;以处理单元(ProcessingElement,PE)为节点,用加权有向弧相互连接而成。需要说明的是,本专利技术实施例中包含一个隐藏层,在实际应用环境中,人工神经本文档来自技高网
...
基于人工神经网络的语音识别方法、装置及电子设备

【技术保护点】
一种基于人工神经网络的语音识别方法,其特征在于,包括:离线训练用于语音识别的人工神经网络模型;在离线训练的所述人工神经网络模型通过测试后,记录所述人工神经网络模型的当前权重和当前偏置值;将所述当前权重和所述当前偏置值作为无线终端采用的所述人工神经网络模型的初始权重和初始偏置值;在线训练采用所述初始权重和所述初始偏置值的所述人工神经网络模型,得到在线训练后的权重和偏置值;将采用所述在线训练后的权重和偏置值的所述人工神经网络模型用于所述无线终端的语音识别。

【技术特征摘要】
1.一种基于人工神经网络的语音识别方法,其特征在于,包括:离线训练用于语音识别的人工神经网络模型;在离线训练的所述人工神经网络模型通过测试后,记录所述人工神经网络模型的当前权重和当前偏置值;将所述当前权重和所述当前偏置值作为无线终端采用的所述人工神经网络模型的初始权重和初始偏置值;在线训练采用所述初始权重和所述初始偏置值的所述人工神经网络模型,得到在线训练后的权重和偏置值;将采用所述在线训练后的权重和偏置值的所述人工神经网络模型用于所述无线终端的语音识别。2.根据权利要求1所述的基于人工神经网络的语音识别方法,其特征在于,所述离线训练用于语音识别的人工神经网络模型包括:获取目标语音数据和干扰语音数据,形成第一训练数据集;将所述人工神经网络模型的权重随机初始化,偏置值从零初始化;根据所述第一训练数据集训练所述人工神经网络模型。3.根据权利要求1所述的基于人工神经网络的语音识别方法,其特征在于,所述离线训练的所述人工神经网络模型通过测试包括:将测试语音数据输入至离线训练后的所述人工神经网络模型,并将所述人工神经网络模型的输出与所述测试语音数据进行比较,得到输出错误率;当所述输出错误率达到设定阈值时,记录所述人工神经网络模型的当前权重和当前偏置值。4.根据权利要求3所述的基于人工神经网络的语音识别方法,其特征在于,所述输出错误率没有达到设定阈值时,将所述人工神经网络模型的所述权重随机初始化,所述偏置值从零初始化。5.根据权利要求1所述的基于人工神...

【专利技术属性】
技术研发人员:柯逸倩孙廷玮
申请(专利权)人:展讯通信上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1