长短时隙结合优化的缓存放置方法、系统及介质技术方案

技术编号:34455433 阅读:50 留言:0更新日期:2022-08-06 17:01
本发明专利技术提供了一种长短时隙结合优化的缓存放置方法、系统及介质,涉及计算机通信技术领域,包括:边缘缓存服务器,所述边缘缓存服务器包括HDD盘和SSD盘,所述HDD盘决策视频文件的流行度,进而从源站将流行视频文件存入HDD盘,同时HDD盘将自主剔除多余的不流行文件;所述SSD盘则存储HDD盘内的高热度文件;方法包括以下步骤:步骤S1:进行长周期HDD盘的缓存替换;步骤S2:完成长周期HDD盘缓存替换后,再针对SSD盘进行短期的缓存替换。本发明专利技术能够提高边缘缓存服务器的命中率,缓解请求高峰时期的网络拥堵与传输负担,降低分发时延,改善用户体验。体验。

【技术实现步骤摘要】
and Clustering 基于视频年龄分割与聚类的多元线性回归模型
[0014]VGP Video file Group Prediction 视频文件分组预测

技术实现思路

[0015]针对现有技术中的缺陷,本专利技术提供一种长短时隙结合优化的缓存放置方法、系统及介质
[0016]根据本专利技术提供的一种长短时隙结合优化的缓存放置方法、系统及介质,所述方案如下:
[0017]第一方面,提供了一种长短时隙结合优化的缓存放置方法,所述方法包括:
[0018]边缘缓存服务器,所述边缘缓存服务器包括HDD盘和SSD盘,所述HDD盘决策视频文件的流行度,进而从源站将流行视频文件存入HDD盘,同时HDD盘将自主剔除多余的不流行文件;所述SSD盘则存储HDD盘内的高热度文件;方法包括以下步骤:
[0019]步骤S1:进行长周期HDD盘的缓存替换;
[0020]步骤S2:完成长周期HDD盘缓存替换后,再针对SSD盘进行短期的缓存替换。
[0021]优选地,所述步骤S1中基于视频年龄分割与聚类的多元线性回归模型RSC作为长期预测算法,包括:离线准备和在线预测两个过程;
[0022]所述离线准备过程主要提取各文件一定长度的历史请求量序列以及发布时间在内的相关信息标签,然后对文件进行年龄分组、聚类以及线性拟合。
[0023]优选地,所述步骤S1具体包括:
[0024]步骤S1.1:按视频年龄分组;根据各文件的发布时间进行分组,将相近年龄段的文件分为同一组;
[0025]步骤S1.2:依据流行度变化趋势相似性聚类;分别在每个年龄组内依据历史请求序列对该组内的文件进行K

means序列聚类,将流行度变化趋势相似的时间序列聚类到一个簇中;其中,使用欧式距离作为时间序列相似性的衡量准则,聚类个数由肘部法则确定;
[0026]步骤S1.3:训练模型;聚类完成后,各个组内均包含多个聚类簇,分别针对各聚类簇建立多元线性回归模型,使用相应簇中的请求量时间序列进行训练,训练完成后每个聚类簇都获得一组拟合参数;
[0027]步骤S1.4:测试;依据测试文件的发布时间,计算测试文件与测试文件对应年龄分组内几个聚类中心的欧式距离,找到与该序列流行度趋势最相似的聚类中心,然后使用该聚类簇的拟合参数对序列进行预测,得到下一更新周期的请求量;
[0028]步骤S1.5:缓存替换;根据预测得到的请求量排名,将预测请求量最高的视频存储到HDD盘,剔除排名低的视频。
[0029]优选地,所述步骤S2中针对SSD盘进行短期的缓存替换,采用视频文件分组预测VGP算法,主要基于请求量对文件进行分类处理,不同种类的文件将采用不同的判决流程,包括如下步骤:
[0030]步骤S2.1:根据文件最近几个周期的请求情况将文件分组,在该时间段被请求复数次则归为热门文件,否则归为冷门文件;
[0031]步骤S2.2:预测;在每个新时刻,使用各文件长时预测的请求量减去当前时刻的累积请求次数,能够预测各文件直到下一次主动更新前还会被请求的次数;
[0032]步骤S2.3:将热门文件分配至SSD盘中,部分冷门文件虽然在过去未被频繁请求,但若在前一时刻被请求,则认为该冷门文件存在一定的未来请求期望,也需要分配至SSD盘;
[0033]步骤S2.4:若步骤S2.3完成后SSD盘中仍有剩余空间,则根据步骤S2.2预测的各文件未来请求量,将未来请求量较高且目前不在SSD盘中的若干文件分配至SSD盘;
[0034]若步骤S2.3完成后SSD盘缓存空间溢出,则同样根据步骤S2.2预测的各文件未来请求量,将未来请求量较少的若干文件从SSD盘剔除。
[0035]第二方面,提供了一种长短时隙结合优化的缓存放置系统,所述系统包括:
[0036]边缘缓存服务器,所述边缘缓存服务器包括HDD盘和SSD盘,所述HDD盘决策视频文件的流行度,进而从源站将流行视频文件存入HDD盘,同时HDD盘将自主剔除多余的不流行文件;所述SSD盘则存储HDD盘内的高热度文件;系统包括以下模块:
[0037]模块M1:进行长周期HDD盘的缓存替换;
[0038]模块M2:完成长周期HDD盘缓存替换后,再针对SSD盘进行短期的缓存替换。
[0039]优选地,所述模块M1中基于视频年龄分割与聚类的多元线性回归模型RSC作为长期预测算法,包括:离线准备和在线预测两个过程;
[0040]所述离线准备过程主要提取各文件一定长度的历史请求量序列以及发布时间在内的相关信息标签,然后对文件进行年龄分组、聚类以及线性拟合。
[0041]优选地,所述模块M1具体包括:
[0042]模块M1.1:按视频年龄分组;根据各文件的发布时间进行分组,将相近年龄段的文件分为同一组;
[0043]模块M1.2:依据流行度变化趋势相似性聚类;分别在每个年龄组内依据历史请求序列对该组内的文件进行K

means序列聚类,将流行度变化趋势相似的时间序列聚类到一个簇中;其中,使用欧式距离作为时间序列相似性的衡量准则,聚类个数由肘部法则确定;
[0044]模块M1.3:训练模型;聚类完成后,各个组内均包含多个聚类簇,分别针对各聚类簇建立多元线性回归模型,使用相应簇中的请求量时间序列进行训练,训练完成后每个聚类簇都获得一组拟合参数;
[0045]模块M1.4:测试;依据测试文件的发布时间,计算测试文件与测试文件对应年龄分组内几个聚类中心的欧式距离,找到与该序列流行度趋势最相似的聚类中心,然后使用该聚类簇的拟合参数对序列进行预测,得到下一更新周期的请求量;
[0046]模块M1.5:缓存替换;根据预测得到的请求量排名,将预测请求量最高的视频存储到HDD盘,剔除排名低的视频。
[0047]优选地,所述模块M2中针对SSD盘进行短期的缓存替换,采用视频文件分组预测VGP算法,主要基于请求量对文件进行分类处理,不同种类的文件将采用不同的判决流程,包括:
[0048]模块M2.1:根据文件最近几个周期的请求情况将文件分组,在该时间段被请求复数次则归为热门文件,否则归为冷门文件;
[0049]模块M2.2:预测;在每个新时刻,使用各文件长时预测的请求量减去当前时刻的累积请求次数,能够预测各文件直到下一次主动更新前还会被请求的次数;
[0050]模块M2.3:将热门文件分配至SSD盘中,部分冷门文件虽然在过去未被频繁请求,
但若在前一时刻被请求,则认为该冷门文件存在一定的未来请求期望,也需要分配至SSD盘;
[0051]模块M2.4:若模块M2.3完成后SSD盘中仍有剩余空间,则根据模块M2.2预测的各文件未来请求量,将未来请求量较高且目前不在SSD盘中的若干文件分配至SSD盘;
[0052]若模块M2.3完成后SSD盘缓存空间溢出,则同样根据模块M2.2预测的各文件未来请求量,将未来请求量较少的若干文件从SSD盘剔本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种长短时隙结合优化的缓存放置方法,其特征在于,包括:边缘缓存服务器,所述边缘缓存服务器包括HDD盘和SSD盘,所述HDD盘决策视频文件的流行度,进而从源站将流行视频文件存入HDD盘,同时HDD盘将自主剔除多余的不流行文件;所述SSD盘则存储HDD盘内的高热度文件;方法包括以下步骤:步骤S1:进行长周期HDD盘的缓存替换;步骤S2:完成长周期HDD盘缓存替换后,再针对SSD盘进行短期的缓存替换。2.根据权利要求1所述的长短时隙结合优化的缓存放置方法,其特征在于,所述步骤S1中基于视频年龄分割与聚类的多元线性回归模型RSC作为长期预测算法,包括:离线准备和在线预测两个过程;所述离线准备过程主要提取各文件一定长度的历史请求量序列以及发布时间在内的相关信息标签,然后对文件进行年龄分组、聚类以及线性拟合。3.根据权利要求2所述的长短时隙结合优化的缓存放置方法,其特征在于,所述步骤S1具体包括:步骤S1.1:按视频年龄分组;根据各文件的发布时间进行分组,将相近年龄段的文件分为同一组;步骤S1.2:依据流行度变化趋势相似性聚类;分别在每个年龄组内依据历史请求序列对该组内的文件进行K

means序列聚类,将流行度变化趋势相似的时间序列聚类到一个簇中;其中,使用欧式距离作为时间序列相似性的衡量准则,聚类个数由肘部法则确定;步骤S1.3:训练模型;聚类完成后,各个组内均包含多个聚类簇,分别针对各聚类簇建立多元线性回归模型,使用相应簇中的请求量时间序列进行训练,训练完成后每个聚类簇都获得一组拟合参数;步骤S1.4:测试;依据测试文件的发布时间,计算测试文件与测试文件对应年龄分组内几个聚类中心的欧式距离,找到与该序列流行度趋势最相似的聚类中心,然后使用该聚类簇的拟合参数对序列进行预测,得到下一更新周期的请求量;步骤S1.5:缓存替换;根据预测得到的请求量排名,将预测请求量最高的视频存储到HDD盘,剔除排名低的视频。4.根据权利要求1所述的长短时隙结合优化的缓存放置方法,其特征在于,所述步骤S2中针对SSD盘进行短期的缓存替换,采用视频文件分组预测VGP算法,主要基于请求量对文件进行分类处理,不同种类的文件将采用不同的判决流程,包括如下步骤:步骤S2.1:根据文件最近几个周期的请求情况将文件分组,在该时间段被请求复数次则归为热门文件,否则归为冷门文件;步骤S2.2:预测;在每个新时刻,使用各文件长时预测的请求量减去当前时刻的累积请求次数,能够预测各文件直到下一次主动更新前还会被请求的次数;步骤S2.3:将热门文件分配至SSD盘中,部分冷门文件虽然在过去未被频繁请求,但若在前一时刻被请求,则认为该冷门文件存在一定的未来请求期望,也需要分配至SSD盘;步骤S2.4:若步骤S2.3完成后SSD盘中仍有剩余空间,则根据步骤S2.2预测的各文件未来请求量,将未来请求量较高且目前不在SSD盘中的若干文件分配至SSD盘;若步骤S2.3完成后SSD盘缓存空间溢出,则同样根据步骤S2.2预测的各文件未来请求量,将未来请求量较少的若干文件从SSD盘剔除。
5.一种长短时隙结合优化的缓存放置系统,其特征在于,包括:边缘缓存服...

【专利技术属性】
技术研发人员:唱佳玲杨俊逸陶梅霞
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1