System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于学习和Belady算法的高效缓存驱逐策略制造技术_技高网

一种基于学习和Belady算法的高效缓存驱逐策略制造技术

技术编号:40338975 阅读:8 留言:0更新日期:2024-02-09 14:27
一种基于学习和Belady算法的高效缓存驱逐策略涉及边缘计算领域。随着5G网络的迅速发展,海量数据的传输加剧了骨干网络的负担,导致网络延迟增加。边缘缓存能够将缓存功能下沉到网络边缘,就近为用户提供所需的内容,从而减轻骨干网络压力,并降低网络延迟。然而,边缘服务器的性能和缓存容量的限制,使得边缘缓存需要一个高效的缓存策略来提高缓存命中率。本发明专利技术实现了一个高效的缓存策略。此外,本发明专利技术基于梯度增强机(GBM)和长短期记忆网络(LSTM),以实现对内容请求的过滤和对内容的下次请求的到达时间进行预测。仿真结果表明,该方案既能够具有较高的缓存命中率,也能够明显降低计算开销。

【技术实现步骤摘要】

本专利技术主要涉及机器学习,边缘计算领域,即利用机器学习和belady算法解决边缘缓存场景下的缓存替换问题。


技术介绍

1、在传统的基于机器学习的belady算法中,需要使用机器学习模型对所有缓存内容进行预测,然后再根据预测结果对缓存内容进行驱逐,频繁的采样和重复预测将造成大量的计算开销,边缘服务器性能有限,可能难以承担如此大的及时开销。同时,这也使得模型的吞吐量较低,难以普及这类缓存算法。因此,在[1]中,作者利用gbm模型,对缓存内容的下次到达时间进行预测,并选择一部分最远到达的缓存内容进行替换,但是,该模型的输入特征是手动设计的,可能存在泛化性问题。在[2]中,作者利用lstm和混合高斯分布设计了混合密度网络,用于预测内容下次到达的时间分布。在[3]中,作者利用循环神经网络预测将要生成的未来请求,然后在缓存中保留那些在预定时间之前至少会被访问一次的项目。在[4]中,作者使用gbm学习算法从最优缓存决策和请求的特征中学习,从而做出缓存决策。在[5]中,作者提出了hawkeye缓存替换策略,该策略学习了过去访问的belady最优解来指导未来的替换决策。但是这些工作都专注于缓存替换中缓存命中率的提升,而没有考虑到模型频繁预测产生的计算开销,会给边缘服务器带来极大的负担,同时,这也会降低模型的吞吐量,使其难以适用于高频率请求的场景。


技术实现思路

1、1)如何制定高命中率的缓存替换策略。缓存命中率是缓存策略的关键指标,理论上最优的缓存策略是基于belady算法,其是替换掉未来最远的被访问的缓存内容。然而,内容的未来访问过程是不能获取的,这导致了缓存策略难以达到最优的缓存性能。

2、2)如何在保证缓存算法性能的前提下,控制模型的计算开销。边缘设备的性能有限,可能难以负担起高额的计算开销。然而,现有的基于belady的缓存策略需要对缓存内容的下次到达时间进行反复的预测,这将会造成大量的计算开销,最后导致模型难以应用到性能较差的边缘服务器中。

3、本专利技术首先设计了一个基于gbm模型的缓存预过滤器,该过滤器用于过滤掉内容请求中访问频率低的内容,以提高缓存命中率并降低计算开销。然后,提出了一种时间预测模型,该模型基于长短期记忆网络(lstm)和多层感知机(mlp)模型,lstm模型能够基于内容历史的到达时间时许,提取其隐藏特征,从而用于进行更加准确的时间预测;同时,本专利技术还选择了等待时间和内容流行度作为输入特征,该类特征易获取,且与内容的访问模型直接相关;将这些特征数据输入到mlp模型中,就能够得到一个预测结果,即是内容的下次到达时间。最后,本专利技术制定了一个驱逐规则,该规则能够重复利用已预测缓存内容的下次到达时间,能够在保证缓存命中率的前提下,大幅度降低计算开销;在缓存已满且内容未命中时,需要将已预测内容中最远到达的内容驱逐,为新内容腾出空间;同时,本专利技术还需要更新维护已预测内容,以保证其可靠性。

4、1.结构描述

5、本专利技术提出了基于学习和belady算法的高效缓存驱逐策略,该方案的应用场景主要是由云端、边缘服务器和移动设备三部分组成,如图1所示。

6、移动设备:是内容请求的发起者。当他们请求内容时,首先会在查询所在边缘服务器的缓存内容,如果命中,则直接从边缘服务器获得内容,否则将从云端获取内容。

7、边缘服务器:用于缓存流行内容,为移动设备就近提供内容服务。当内容请求到达边缘服务器时,如果请求的内容位于边缘服务器中,则将内容分发到移动设备。如果内容不位于边缘服务器,则需要从云端获取,并基于该内容的信息对其进行预测,以判断该内容是否需要缓存,并作出缓存决策。

8、云端:用于为边缘服务器和移动设备分发内容。当请求到达云端时,云端会将内容分发到边缘服务器,再由边缘服务器将内容分发给移动设备。

9、2.系统模型

10、本专利技术的模型构建主要包括两部分:1)模型训练。通过历史信息来提取训练数据,然后将获得的训练数据输入到缓存预过滤器和时间预测模型中,进行模型训练。如图2所示,机器学习模型所需要的输入包括内容的历史到达时间间隔序列tin、内容的存续时间ts、内容的等待时间tw和内容流行度特征sim;获取内容的下次到达时间间隔tout作为模型的预测目标。当训练数据量达到阈值时,即可进行模型训练,更新模型。2)模型应用。如图2所示,右侧为该模型的运行流程。首先,考虑到内容的到达过程的时变性,每个时隙开始时,缓存内所有内容的状态会被重置为未预测,用0表示;然后,当请求内容c命中时,该内容状态重置为未预测;如果内容未命中,则需要获取该内容的特征数据,包括过去到达时间间隔序列τ、存续时间ts和内容的流行度特征simtc,其中simtc表示内容c在时隙t内的内容流行度特征,将特征数据输入到缓存预过滤器,判断该内容是否需要被缓存。如果不需要缓存,则该算法结束;如果需要,则根据输入预测内容的下次到达时间间隔tp;如果当前已预测的内容数量小于nmax-n,则从cnp中随机采样n个内容,以预测它们的下次到达时间,这里nmax是缓存空间中的内容数量,n是每次采样的大小。最后,驱逐已预测内容cp中下次到达时间最远的内容。

11、本专利技术主要应用在边缘服务器的缓存决策中,当前边缘网络的内容请求频繁,且存在内容访问高峰期,这使得边缘服务器需要一种既能够提供高命中率,又能够提供高吞吐量的缓存策略。因此,本专利技术所需要解决的问题是:1)提高模型的缓存命中率;2)控制模型的计算开销,使其拥有较高的吞吐率。

12、传统的基于启发式算法的缓存策略(例如lru、lfu等)的计算开销低,吞吐量高,但是相应的,它们难以适应边缘网络中复杂的内容访问模型,能够卸载的流量有限。而基于机器学习的缓存策略虽然拥有更高的缓存命中率,但是其会造成较高的计算开销,在边缘服务器性能有限的情况下,这将给边缘服务器造成较大的负担。因此,如何制定一个缓存命中率高且计算开销低的缓存策略,平衡模型计算开销和缓存命中率变得至关重要,尤其是在内容访问的高峰期。

13、通过对以往基于belady算法和学习的缓存策略的研究,该类缓存策略需要对缓存内容的下次到达时间进行反复的预测,这导致了大量的计算开销。但是,这些缓存策略的决策前提都包括预测结果的可靠性,基于这个理念,本专利技术将重复利用内存预测的预测结果,以此来降低预测频率。同时,由于内容的访问特点,只有少部分内容会被频繁访问,大多数内容会存在访问频率低的问题,甚至在被驱逐前从未被访问过。为了解决掉这个问题,本专利技术设计了一个缓存预过滤器,该过滤器能够过滤掉部分访问频率低的未命中内容请求,由于缓存预过滤器的计算开销远低于时间预测模型,因此,过滤器的存在能够减少模型计算开销,并提高缓存命中率。最后,设计了一个新的驱逐规则,使其能够通过更新内容状态,以保证内容预测结果的可靠性。

14、3.数据处理

15、它旨在处理历史数据以训练预测模型。首先,设置一个滑动窗口来存储最新的缓存请求;然后,根据记录的信息来收集训练本文档来自技高网...

【技术保护点】

1.一种基于学习和Belady算法的高效缓存驱逐策略,其特征在于:

【技术特征摘要】

1.一种基于学习和belady算法...

【专利技术属性】
技术研发人员:王茜周文斌
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1