基于boosting算法的边缘云服务器利用率预测方法、预测装置及存储介质制造方法及图纸

技术编号:34096579 阅读:23 留言:0更新日期:2022-07-11 22:27
本发明专利技术提供了一种基于boosting算法的边缘云服务器利用率预测方法、预测装置及存储介质,其中方法包括:S1基于boosting算法模型,获取被预测带宽利用率数据;S2建立最近数据专注机制,包括:计算各服务器实际带宽利用率数据与被预测带宽利用率数据之间的时间差;为每条服务器实际带宽利用率数据生成一个介于时间差最小值与最大值之间的随机数后;保留时间差小于该随机数的带宽利用率数据,生成服务器专注特征数据;S3基于所述服务器专注特征数据进一步训练boosting算法模型生成R

【技术实现步骤摘要】
基于boosting算法的边缘云服务器利用率预测方法、预测装置及存储介质


[0001]本专利技术涉及人工智能应用领域,尤其涉及基于boosting算法的边缘云服务器利用率预测方法、预测装置及存储介质。

技术介绍

[0002]随着边缘计算网络架构的发展,边缘云服务的潜力得到进一步发掘,面向于服务基础设备供应商、内容提供商(CP)以及网络用户的边缘云平台展现出巨大的商业价值。边缘云服务平台的优势在于: 1、对下可以整合各类异构的边缘服务器资源,最大化硬件价值;2、对上可以为各类内容提供商提供灵活部署的边缘网络服务;3、可以利用边缘计算的优势,为最上层用户提供低时延、高可靠的边缘服务。
[0003]虽然边缘云服务平台具有以上种种优势,但其面临大量异构设备的统一管理、任务实例在服务器的精确部署、用户需求和服务器之间的高效实时调度等重要问题;其中,边缘云服务器的带宽利用率属性,是平台在服务器进行任务部署时要参考的主要特征。
[0004]在实际生产中,服务器的带宽利用率与下游资源提供商、平台以及上游内容提供客户的利益都有着较强的正相关关系,即服务器的综合带宽利用率越高,三方的收益都会呈现相应的增长。除此之外,较高的服务器带宽利用率说明任务与对应服务器适配良好,这保证了服务器的硬件资源不被浪费,也保证了该服务器被服务的用户的良好用户体验。
[0005]因此如何在服务器正确部署任务,以保证服务器的带宽利用率最大化,是边缘云服务平台进行任务部署的核心策略,而这策略的制定离不开对异构服务器在不同任务、不同时间节点下的带宽利用率的精确估计。
[0006]以往通常这些预估工作大多依靠人为分析和决策解决,然而随着人工智能的发展,机器学习方法在学术界和产业界都得到了广泛应用,专利技术人开始尝试通过训练机器学习模型的方式,来对边缘云服务器利用率进行预测,如专利技术人曾经试验以:聚类回归(Clustering) 算法、逻辑回归(Logistic Regression, LR)算法、多层感知机(Multilayer Perceptron, MLP) 、XGBoosting算法等,来对边缘云服务器利用率进行预测的方案,但结果并不理想。
[0007]因此专利技术人认为现有此类算法预测准确率还有待提高,为此专利技术人期望能通过本案进一步提升预测准确率。

技术实现思路

[0008]为此本专利技术的主要目的在于提供一种基于Boosting算法的边缘云服务器利用率预测方法、预测装置及存储介质,以在Boosting算法基础上融入最近数据注意力筛选机制(Recent Attention),从而有效筛选Boosting模型输入侧的数据规模,以提高模型训练速度及预测准确率。
[0009]为了实现上述目的,根据本专利技术的一个方面,提供了一种基于boosting算法的边
缘云服务器利用率预测方法,步骤包括:S1基于boosting算法模型,获取被预测带宽利用率数据;S2建立最近数据专注机制,包括:计算各服务器实际带宽利用率数据与被预测带宽利用率数据之间的时间差;为每条服务器实际带宽利用率数据生成一个介于时间差最小值与最大值之间的随机数后;保留时间差小于该随机数的带宽利用率数据,生成服务器专注特征数据;S3基于所述服务器专注特征数据进一步训练boosting算法模型生成R

Aboosting算法模型,以输出各服务器预测带宽利用率数据。
[0010]在可能的优选实施方式中,其中步骤S3中所述R

Aboosting算法模型生成步骤包括:S31定义boosting基模型为基于回归决策树的基预测模型;S32调整目标函数和决策树的复杂度,以通过近似算法分裂决策树节点生成单个的回归决策树基模型;S33基于服务器专注特征数据采用残差学习来训练和集成所有单个的回归决策树基模型,以生成R

Aboosting算法模型。
[0011]在可能的优选实施方式中,还包括:步骤S34,设定服务器利用率以天为尺度,将服务器专注特征数据以天划分,限制R

Aboosting算法模型训练中只提供对目前积累数据最新日期下一天的预测结果。
[0012]在可能的优选实施方式中,还包括:步骤S44,设定服务器利用率以自然周为尺度,将服务器专注特征数据进行自然周划分,步骤包括:采用窗口跳动取数据的方法,将后组周数据紧邻前组周数据但无交叉,在数据划分后对一组周数据依据服务器ID进行服务器特征和带宽利用率的取平均作为一条新的周服务器专注特征数据,以供R

Aboosting算法模型训练,并输出对目前积累数据最新日期下一天开始的一个自然周下的平均带宽利用率。
[0013]在可能的优选实施方式中,其中步骤S32中通过近似算法分裂决策树节点,并且每次分裂前重新提出候选切分点,以此生成单个的回归决策树基模型。
[0014]在可能的优选实施方式中,其中步骤S32中目标函数和决策树的复杂度的步骤包括:建立损失损失函数建立损失损失函数其中为预测带宽利用率,为实际带宽利用率,N为服务器数量;在损失函数的基础上添加正则项,以组成目标函数:其中,是将全部t棵决策树的复杂度进行求和,添加到目标函数中作为正则项,防止模型过拟合,通过泰勒公式展开,以将目标函数型变为如下公式:其中g为损失函数的一阶导,h为损失函数的二阶导。
[0015]在可能的优选实施方式中,该目标函数的正则项由生成的所有决策树的叶子节点
数量T,和所有节点权重所组成的向量的范式共同决定,其公式为:。
[0016]为了实现上述目的,根据本专利技术的二个方面,还提供了一种基于boosting算法的边缘云服务器利用率预测方法,步骤包括:S1获取各服务器特征包括:服务器性能特征、对应部署任务类别、被预测所在时间特征,将边缘云服务器带宽利用率预测建模为一个回归任务;S2清洗服务器历史数据集后,按比例进行缩放,使数据落入一个预设特定区间,并且转化为一个无量纲的纯数值,以供boosting算法学习,并输出被预测带宽利用率数据;S3建立最近数据专注机制,包括:计算各服务器实际带宽利用率数据与被预测带宽利用率数据之间的时间差;为每条服务器实际带宽利用率数据生成一个介于时间差最小值与最大值之间的随机数后;保留时间差小于该随机数的带宽利用率数据,生成服务器专注特征数据;S4基于所述服务器专注特征数据进一步训练boosting算法模型生成R

Aboosting算法模型,以输出各服务器预测带宽利用率数据。
[0017]在可能的优选实施方式中,步骤S4中所述R

Aboosting算法模型生成步骤包括:S41定义boosting基模型为基于回归决策树的基预测模型;S42调整目标函数和决策树的复杂度,以通过近似算法分裂决策树节点生成单个的回归决策树基模型;S43基于服务器专注特征数据采用残差学习来训练和集成所有单个的回归决策树基模型,以生成R

Aboosting算法模型。
...

【技术保护点】

【技术特征摘要】
1.基于boosting算法的边缘云服务器利用率预测方法,步骤包括:S1基于boosting算法模型,获取被预测带宽利用率数据;S2建立最近数据专注机制,包括:计算各服务器实际带宽利用率数据与被预测带宽利用率数据之间的时间差;为每条服务器实际带宽利用率数据生成一个介于时间差最小值与最大值之间的随机数后;保留时间差小于该随机数的带宽利用率数据,生成服务器专注特征数据;S3基于所述服务器专注特征数据进一步训练boosting算法模型生成R

Aboosting算法模型,以输出各服务器预测带宽利用率数据。2.基于boosting算法的边缘云服务器利用率预测方法,步骤包括:S1获取各服务器特征包括:服务器性能特征、对应部署任务类别、被预测所在时间特征,将边缘云服务器带宽利用率预测建模为一个回归任务;S2清洗服务器历史数据集后,按比例进行缩放,使数据落入一个预设特定区间,并且转化为一个无量纲的纯数值,以供boosting算法学习,并输出被预测带宽利用率数据;S3建立最近数据专注机制,包括:计算各服务器实际带宽利用率数据与被预测带宽利用率数据之间的时间差;为每条服务器实际带宽利用率数据生成一个介于时间差最小值与最大值之间的随机数后;保留时间差小于该随机数的带宽利用率数据,生成服务器专注特征数据;S4基于所述服务器专注特征数据进一步训练boosting算法模型生成R

Aboosting算法模型,以输出各服务器预测带宽利用率数据。3.根据权利要求2所述的基于boosting算法的边缘云服务器利用率预测方法,其中步骤S4中所述R

Aboosting算法模型生成步骤包括:S41定义boosting基模型为基于回归决策树的基预测模型;S42调整目标函数和决策树的复杂度,以通过近似算法分裂决策树节点生成单个的回归决策树基模型;S43基于服务器专注特征数据采用残差学习来训练和集成所有单个的回归决策树基模型,以生成R

Aboosting算法模型。4.根据权利要求3所述的基于boosting算法的边缘云服务器利用率预测方法,其中还包括:步骤S44,设定服务器利用率以天为尺度,将服务器专注特征数据以天划分,限制R

Aboosting算法模型训练中只提...

【专利技术属性】
技术研发人员:李星星黄少远王晓飞
申请(专利权)人:缀初网络技术上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1