一种用于语音识别的新型时延递归神经网络制造技术

技术编号:20392557 阅读:62 留言:0更新日期:2019-02-20 03:56
本发明专利技术公开了一种用于语音识别的新型时延递归神经网络,包括线性判别分析层、时延神经网络层和深度时延递归神经网络层,线性判别分析层与时延神经网络层最下层连接,深度时延递归神经网络层设置在两个时延神经网络层之间,包括深度神经网络层和时延递归神经网络层,时延递归神经网络层分别与上下两层时延神经网络层连接,深度神经网络层中的普通神经网络结构与时延递归神经网络层中的时延递归神经网络结构对应连接;本发明专利技术的一种用于语音识别的新型时延递归神经网络可在保持网络结构简单的同时,达到和长短时记忆单元相似的效果,从而提高训练效率、减少运算消耗、减少模型体积。

【技术实现步骤摘要】
一种用于语音识别的新型时延递归神经网络
本专利技术涉及语音识别的声学模型建模领域,具体涉及一种用于语音识别的新型时延递归神经网络。
技术介绍
随着智能语音技术的日渐发展,如Siri、Alexa和Cortana这样的智能助手正走进千家万户,极大的方便了大家的日常生活。语音识别是智能语音技术的关键环节,通过语音识别技术,可以将语音数据转换为文本数据,以便后续处理。一般来说,语音识别系统由声学模型和语言模型组成。在现今,基于神经网络构建的声学模型相对于早期的基于混合高斯模型的声学模型,效果提升显著,并且被广泛的应用在各种知名的语音识别系统中。在语音识别中,如何有效地组织、提取和处理声音特征帧的上下文信息,是一个研究焦点。目前为止,声学建模效果较好的神经网络有基于降采样技术的时延神经网络和基于递归神经网络的长短时记忆单元。采用了降采样技术的时延神经网络由于没有递归结构,具有训练收敛速度快、模型参数量少的特点;而长短时记忆单元由于具有长时记忆功能,因此建模效果更好,但是训练过程繁琐、费时,网络结构复杂、体积大。在实践中,两种网络往往混搭使用,相辅相成。
技术实现思路
有鉴于此,为解决上述现有技术中本文档来自技高网...

【技术保护点】
1.一种用于语音识别的新型时延递归神经网络,其特征在于:包括线性判别分析层、时延神经网络层和深度时延递归神经网络层,所述线性判别分析层与时延神经网络层最下层连接,所述深度时延递归神经网络层设置在两个时延神经网络层之间,包括深度神经网络层和时延递归神经网络层,所述时延递归神经网络层分别与上下两层时延神经网络层连接,所述深度神经网络层中的普通神经网络结构与时延递归神经网络层中的时延递归神经网络结构对应连接,所述深度神经网络层用于增加递归路径的深度,加强递归信息的表达能力。

【技术特征摘要】
1.一种用于语音识别的新型时延递归神经网络,其特征在于:包括线性判别分析层、时延神经网络层和深度时延递归神经网络层,所述线性判别分析层与时延神经网络层最下层连接,所述深度时延递归神经网络层设置在两个时延神经网络层之间,包括深度神经网络层和时延递归神经网络层,所述时延递归神经网络层分别与上下两层时延神经网络层连接,所述深度神经网络层中的普通神经网络结构与时延递归神经网络层中的时延递归神经网络结构对应连接,所述深度神经网络层用于增加递归路径的深度,加强递归信息的表达能力。2.根据权利要求1所述的一种用于语音识别的新型时延递归神经网络,其特征在于:所述时延递归神经网络结构包括时延神经网络结构和递归神经网络结构,所述时延神经网络结构的上下文输入直接输入到递归神经网络结构中,与递归神经网络结构相结合,所述时延递归神经网络结构用于减少网络层数。3.根据权利要求1所述的一种用于语音识别的新型时延递归神经网络,其特征在于,所述时延神经网络结构中,其输出按照以下公式计算:Yt=f(WCt+b);Ct={Xt-n,Xt+n}其中Xt、Yt是t时刻的输入输出,f是非线性函数,WCt+b是仿射运算,W为仿射运算中的二维矩阵,b表示方向向量,Ct是经过拼接...

【专利技术属性】
技术研发人员:刘柏基张伟彬徐向民
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1