一种独立化长短期记忆网络模型的构建方法技术

技术编号:19904585 阅读:36 留言:0更新日期:2018-12-26 03:15
本公开提供了一种独立化长短期记忆网络模型的构建方法,包括:步骤S101:初始化独立化长短期记忆网络模型的参数;步骤S201:对独立化长短期记忆网络模型进行更新;步骤S301:利用梯度后向传播优化独立化长短期记忆网络模型。

【技术实现步骤摘要】
一种独立化长短期记忆网络模型的构建方法
本公开涉及属于人工智能领域,尤其涉及一种独立化长短期记忆网络模型的构建方法。
技术介绍
在深度学习领域,时序数据分析的关键在于建立不同时刻时序数据之间的联系。现有时序数据分析一般采用循环神经网络(RNN)及其变种(如LSTM),通过将当前时刻的数据输出作为下一时刻的额外输入,以此建立起不同时刻时序数据之间的联系,进而实现神经网络的记忆功能。然而,现有循环神经网络模型对历史信息的记忆能力严重不足,主要表现在:只能建立短时间内序列数据之间的关联性,无法建立相距较远序列数据之间的关联性。为此,本专利技术构建了一种新型的循环神经网络结构,实现超长时序数据记忆能力。与本专利技术密切相关的神经网络模型是长短期记忆网络模型(LSTM)。该模型通过制定门结构使得时序信息能够在时间上传递得更久,从而实现记忆功能。但是,LSTM仅仅是减缓的梯度的后向传递问题,将原有的梯度矩阵连乘转化为一系列矩阵的加和,但是加和分量中依然包含了大量矩阵的连乘。在应用记忆模块进行数据更新的时候,传统的结构使用了矩阵乘法以确保信息之间的相互影响,但是该做法在处理长序列时容易产生梯度爆炸本文档来自技高网...

【技术保护点】
1.一种独立化长短期记忆网络模型的构建方法,包括:步骤S101:初始化独立化长短期记忆网络模型的参数;步骤S201:对独立化长短期记忆网络模型进行更新;步骤S301:利用梯度后向传播优化独立化长短期记忆网络模型。

【技术特征摘要】
1.一种独立化长短期记忆网络模型的构建方法,包括:步骤S101:初始化独立化长短期记忆网络模型的参数;步骤S201:对独立化长短期记忆网络模型进行更新;步骤S301:利用梯度后向传播优化独立化长短期记忆网络模型。2.如权利要求1所述的构建方法,所述步骤S201包括:子步骤S201a:将时间序列输入独立化长短期记忆网络模型;子步骤S201b:根据时间序列和记忆模块更新输入门;子步骤S201c:根据时间序列和记忆模块更新遗忘门;子步骤S201d:更新记忆模块;子步骤S201e:根据时间序列和记忆模块更新输出门;子步骤S201f:更新输出。3.如权利要求1所述的构建方法,所述更新输入门的表达式为:其中,it表示时间步t的输入门;σ表示饱和的激活函数;表示向量间的元素对应乘法;xt表示时间序列中的第t个输入向量;ct-1表示时间步t-1的记忆模块;Wxi表示输入向量与输入门之间的参数矩阵;Wci表示记忆模块与输入门之间的参数矩阵。4.如权利要求1所述的构建方法,所述更新遗忘门的表达式为:其中,ft表示时间步t的遗忘门;Wxf表示输入向量与遗忘门之间的参数矩阵;Wcf表示记忆模块与遗忘门之间的参数矩阵;σ表示饱和...

【专利技术属性】
技术研发人员:庄连生李厚强唐明宇杨健
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1