基于二维长短期记忆神经网络的超级计算机工作负载预测方法技术

技术编号：21913767 阅读：18 留言：0更新日期：2019-08-21 12:22

本发明专利技术公开了一种基于二维长短期记忆神经网络的超级计算机工作负载预测方法。第一步，建立具有日期与时间二维时间序列特征的超级计算机工作负载x

Supercomputer workload forecasting method based on two-dimensional long-term and short-term memory neural network

全部详细技术资料下载

【技术实现步骤摘要】
基于二维长短期记忆神经网络的超级计算机工作负载预测方法
本专利技术属于计算机软件以及大规模超级计算机资源管理
，涉及一种基于二维长短期记忆神经网络的超级计算机工作负载预测方法。
技术介绍
随着社会经济和科学技术的进步，高能物理计算、核聚变模拟、航空宇宙计算、飓风预测等高计算需求与复杂应用成为高性能超级计算系统发展的主要动力，推动着以我国“神威太湖之光”、“Tianhe-2”和美国“Titan”为代表的超级计算机向大规模、异构化方向发展。例如，TOP500排名第四的“Tianhe-2”由IntelXeonE5-269212C多核CPU与IntelXeonPhiMIC众核处理器构成，总计312万处理核，计算能力达33862.7TFLOP/S；排名第九的“Titan”由AMDOpteron6274多核CPU与NVIDIATeslaK20XGPU众核处理器构成，总计560640处理核，计算能力达17590TFLOP/S；“Tianhe-1A”由XeonX5670多核CPU与NVIDIATeslaC2050GPU众核处理器构成，总计186368处理核，计算能力也达2566TFLOP/S。然而，随着超级计算机规模持续扩大、计算能力不断增强、应用越来越复杂，系统面临可靠性墙、能耗墙、并行墙等大量挑战性问题，导致复杂并行应用程序应用效率低下，如大规模基因组预测软件只能利用4000核进行并行计算，而无法利用超级计算机的上百万核。另外，超级计算机系统可用性与能耗也是制约其应用效率的重要键性因素，如“Tianhe-2”功耗为17808KW，其耗电量相当于广州大学城5所大学...

【技术保护点】
1.一种基于二维长短期记忆神经网络的超级计算机工作负载预测方法，其特征在于，包括如下步骤：步骤1：基于超级计算机系统处理器的总核数、用于执行任务的核数和执行任务的时间，建立具有日期与时间二维时间序列特征的超级计算机工作负载模型；步骤2：设置包括输入门、遗忘门、输出门和存储器在内的二维长短期记忆神经网络Cell结构，神经网络包括输入层、隐含层和输出层，且神经网络前一隐含层向下一隐含层同时传递隐含层日期维计算信息h

【技术特征摘要】
1.一种基于二维长短期记忆神经网络的超级计算机工作负载预测方法，其特征在于，包括如下步骤：步骤1：基于超级计算机系统处理器的总核数、用于执行任务的核数和执行任务的时间，建立具有日期与时间二维时间序列特征的超级计算机工作负载模型；步骤2：设置包括输入门、遗忘门、输出门和存储器在内的二维长短期记忆神经网络Cell结构，神经网络包括输入层、隐含层和输出层，且神经网络前一隐含层向下一隐含层同时传递隐含层日期维计算信息hd-1,t和时间维计算信息hd,t-1，其中d表示日期、t表示时间；步骤3：将步骤1中得到的以二维形式表达的工作负载转换为一维数据来进行训练，将训练数据输入至二维长短期记忆神经网络Cell结构的输入门、遗忘门、输出门和存储器中的实现公式为：It＝W(i)Xt+h(d-1,t)UD(i)+h(d,t-1)UH(i)Gt＝W(c)Xt+h(d-1,t)UD(c)+h(d,t-1)UH(c)Ft＝W(f)Xt+h(d-1,t)UD(f)+h(d,t-1)UH(f)Ot＝W(o)Xt+h(d-1,t)UD(o)+h(d,t-1)UH(o)Ct＝σ(It)*tanh(Gt)+σ(Ft)*Ct-1ht＝σ(Ot)*tanh(Ct)其中，i、f、o和c分别表示输入门、遗忘门、输出门和存储器，符号It、Ft、Ot和Gt分别是输入门、遗忘门、输出门和存储器在时刻t的输出结果，并由激活函数控制；Ct是t时刻状态信息，ht是t时刻输出结果，激活函数采用sigmoid函数，其中激活函数σ为：另一激活函数tanh为W、UD、UH分别是输入层到隐含层权重、前一隐含层向下一隐含层传送日期hd-1,t的权重、前一隐含层向下一隐含层传送时间hd,t-1二维隐含层计算信息的权重，符号C和h分别是二维长短期记忆神经网络Cell结构状态值和隐含层计算值，最后，所有隐含层信息向输出层转化，产生预测值yt，形式表示为：yt＝σ(W(out)ht)。步骤4：对于t时刻，预测误差E(t)是时刻t和t-1的系统实际工作负载与预测值yt、yt-1的标准方差，即步骤5：在误差反向传播阶段中进行参数权重更新，通过利用偏导数的大小来实现误差反向传播，并在每次迭代训练后确定神经网络Cell结构W、UD、UH和隐含层到输出层W(out)参数权值，其中隐含层计算值ht偏导数相对于t时刻训练误...

【专利技术属性】
技术研发人员：唐小勇，
申请(专利权)人：湖南农业大学，
类型：发明
国别省市：湖南,43

全部详细技术资料下载我是这个专利的主人