The invention proposes a resource prediction mechanism of data flow system based on deep belief network (DBN), which is realized by unsupervised deep learning and time series analysis based on DBN. The mechanism is divided into two stages, data preprocessing and model training: data preprocessing stage mainly adopts smoothing method to preprocess data, and generates a differential transformation from the original time series data to eliminate the linear factors in the data; model training stage consists of two layers of RBMs DBN network model to fit the data, and then to predict the load of nodes. Analysis. The deep learning mechanism of the invention provides short-term load and long-term load forecasting, and can fully understand the state of the system when submitting computing tasks.
【技术实现步骤摘要】
一种基于深度置信网的数据流系统资源预测机制
本专利技术涉及深度学习、时间序列分析、流数据处理领域,具体涉及到一种基于深度置信网的数据流系统资源预测机制。
技术介绍
数据流的日志采集系统通常会面临系统资源的匮乏问题,如何调度系统资源实现合理分配是系统效率高低的重要保障。如日志收集系统Flume,也存在节点负载资源的缺乏,无法预知某时间段的系统状态以及长时间或短时间的资源负载情况。深度置信网作为无监督的深度学习网络模型,可以实现模型的自动训练,以时序数据作为训练,预测资源负载情况。近年来最接近本专利技术的技术有:(1)、深度置信网络:DBN是一个概率生成模型,Hinton于2006年提出了基于玻尔兹曼机(RBM,RestrictedBoltzmannMachine)的深度置信网络(DeepBeliefNetwork)结构。最初该网络应用在图像领域的研究之中,近年来深度置信网络在序列学习方面带来了新的应用,为此创新应用到资源负载预测方面。该方法对于深度学习资源数据之间的关系,实现对系统长期资源以及短期资源的粗略预估,提高了系统状态的透明度。
技术实现思路
为解决现有技术中的缺点和不足,本专利技术提出了一中基于深度置信网(DBN)的数据流系统资源预测机制,解决数据流系统资源负载的预测。本专利技术的技术方案为:采用无监督的深度学习,以DBN为基础,进行时间序列分析。主要包括预处理和模型训练阶段,数据预处理阶段主要采取平滑的方法对数据进行预处理,从原始的时间序列数据生成一个差分变换以消除数据中的线性因素;模型训练阶段由两层RBMs构成的DBN网络模型对数据进行拟合训练,然 ...
【技术保护点】
1.一种基于深度置信网的数据流系统资源预测机制,其特征在于,采用无监督的深度学习,以DBN为基础,进行时间序列分析来实现。包括以下步骤:步骤(1)、数据预处理:采取平滑方法对数据进行预处理,从原始的时间序列数据生成一个差分变换,以消除数据中的线性因素,建立数据库;步骤(2)、由两层RBMs构成的DBN模型初始化并重构接入数据哭,进行模型训练;步骤(3)、使用BP算法来对每一个RBM的链接权重进行调优,并将未被学习的负载数据输入到前面被训练出来的模型,并预测短期和长期负载。
【技术特征摘要】
1.一种基于深度置信网的数据流系统资源预测机制,其特征在于,采用无监督的深度学习,以DBN为基础,进行时间序列分析来实现。包括以下步骤:步骤(1)、数据预处理:采取平滑方法对数据进行预处理,从原始的时间序列数据生成一个差分变换,以消除数据...
【专利技术属性】
技术研发人员:任鹏程,张卫山,房凯,
申请(专利权)人:中国石油大学华东,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。