System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 缓存数据处理方法、装置、设备、存储介质及程序产品制造方法及图纸_技高网

缓存数据处理方法、装置、设备、存储介质及程序产品制造方法及图纸

技术编号:42601286 阅读:15 留言:0更新日期:2024-09-03 18:12
本发明专利技术公开了一种缓存数据处理方法、装置、设备、存储介质及程序产品,该方法包括:获取缓存区中缓存数据的数据访问序列;对所述数据访问序列进行表征学习,得到第一特征向量序列;对所述第一特征向量序列进行数据访问关联性的学习,得到文件系统中各访问数据的预取概率;基于所述预取概率,对所述访问数据进行预取处理,以存入所述缓存区。本申请可以提高数据的缓存命中率。

【技术实现步骤摘要】

本专利技术涉及网络缓存,尤其涉及一种缓存数据处理方法、装置、设备、存储介质及程序产品


技术介绍

1、目前,为提高系统读取性能、减少应用程序的响应时间,主要是在高速数据存储层中临时存储数据的子集,当被缓存数据被请求时,可以快速的提供所请求的数据,也即是通过缓存技术提高数据的访问速度以及系统性能。

2、而缓存的替换和预取是影响缓存工作效率的重要因素,由于目前缓存的替换和预取是使用基于频率和概率、非启发式的算法或者随机算法等,因此导致数据的缓存命中率较低。


技术实现思路

1、本专利技术的主要目的在于提供了一种缓存数据处理方法、装置、设备、存储介质及程序产品,旨在解决现有技术数据的缓存命中率较低的技术问题。

2、为实现上述目的,本专利技术提供了一种缓存数据处理方法,所述方法包括以下步骤:

3、获取缓存区中缓存数据的数据访问序列;

4、对所述数据访问序列进行表征学习,得到第一特征向量序列;

5、对所述第一特征向量序列进行数据访问关联性的学习,得到文件系统中各访问数据的预取概率;

6、基于所述预取概率,对所述访问数据进行预取处理,以存入所述缓存区。

7、可选地,所述获取缓存区中缓存数据的数据访问序列,包括:

8、获取所述缓存区中缓存数据的访问日志集;

9、对所述访问日志集进行日志序列抽取,得到访问日志序列集;其中,所述访问日志序列集包括至少两条访问日志序列;

10、抽取所述访问日志序列集中各访问日志序列内各访问日志的日志属性,得到与各所述访问日志序列相对应的会话要素序列;

11、对各所述会话要素序列进行重组,得到与各所述访问日志序列相对应的所述数据访问序列。

12、可选地,所述对所述第一特征向量序列进行数据访问关联性的学习,得到文件系统中各访问数据的预取概率,包括:

13、在所述第一特征向量序列中添加特殊嵌入向量,得到新的第一特征向量序列;

14、将位置嵌入向量、段嵌入向量和所述新的第一特征向量序列的和,作为第一待编码向量;

15、对所述第一待编码向量进行数据访问关联性的学习,得到第一编码输出向量;

16、将所述第一编码输出向量输入解码器,得到所述解码器输出的第一解码输出向量;

17、对所述第一解码输出向量进行转换处理,得到文件系统中各访问数据的预取概率。

18、可选地,所述基于所述预取概率,对所述访问数据进行预取处理之前,所述方法还包括:

19、基于所述缓存数据生成缓存内容列表;

20、对所述缓存内容列表进行表征学习,得到第二特征向量序列;

21、在所述第二特征向量序列中添加特殊嵌入向量,得到新的第二特征向量序列;

22、将所述新的第二特征向量、位置嵌入向量和段嵌入向量之和,作为第二待编码向量;

23、对所述第二待编码向量进行数据访问关联性的学习,得到第二编码输出向量;

24、将所述第二编码输出向量输入解码器,得到所述解码器输出的第二解码输出向量;

25、对所述第二解码输出向量进行转换处理,得到缓存区中各所述缓存数据的替换概率;

26、基于所述替换概率,对所述缓存数据进行替换处理,以将所述缓存数据从所述缓存区中移除。

27、可选地,所述解码器包括替换解码器和预取解码器,所述第一解码输出向量为预取解码输出向量,所述第二解码输出向量为替换解码输出向量;

28、所述将所述第一编码输出向量输入解码器,得到所述解码器输出的第一解码输出向量,包括:

29、将所述第一编码输出向量输入所述预取解码器,得到所述预取解码器输出的预取解码输出向量;

30、所述将所述第二编码输出向量输入解码器,得到所述解码器输出的第二解码输出向量,包括:

31、将所述第二编码输出向量输入所述替换解码器,得到所述替换解码器输出的替换解码输出向量。

32、可选地,所述将所述第一编码输出向量输入解码器,得到所述解码器输出的第一解码输出向量之前,所述方法还包括:

33、获取训练样本集;其中,所述训练样本集包括缓存列表、正替换样本、负替换样本、正预取样本、预取任务输入以及负预取样本;

34、利用所述训练样本集分别对初始预取解码器和初始替换解码器进行训练,得到所述替换解码器和所述预取解码器。

35、可选地,所述获取训练样本集,包括:

36、获取缓存区的在不同时间段的历史数据访问序列;

37、从所有所述历史数据访问序列中,确定出多个目标历史数据访问序列;

38、基于第一占比,对所有所述目标历史数据访问序列的后部分进行截取,得到与各所述目标历史数据访问序列相对应的第一子序列;

39、基于所有所述第一子序列,构建所述正预取样本,并将各所述目标历史数据访问序列除所述第一子序列以外的剩余序列作为所述预取任务输入;

40、从除所述目标历史数据访问序列的所述历史数据访问序列中,确定出负预取样本;其中所述负预取样本的数量大于所述正预取样本的数量;

41、基于第二占比,对所有所述目标历史数据访问序列的前部分进行截取,得到与各所述目标历史数据访问序列相对应的第二子序列;

42、基于所有所述第二子序列,构建所述缓存列表,并将各所述目标历史数据访问序列除所述第二子序列以外的剩余序列作为所述正替换样本;

43、从除所述目标历史数据访问序列的所述历史数据访问序列中,确定出负替换样本;其中所述负替换样本的数量大于所述正替换样本的数量。

44、可选地,所述利用所述训练样本集分别对初始预取解码器和初始替换解码器进行训练,得到所述替换解码器和所述预取解码器,包括:

45、对所述预取任务输入进行表征学习,得到第三特征向量序列;

46、在所述第三特征向量序列中添加特殊嵌入向量,得到新的第三特征向量序列;

47、对所述新的第三特征向量序列进行关联性的学习,得到待解码预取嵌入向量;

48、将所述待解码预取嵌入向量输入所述初始预取解码器,得到所述初始预取解码器输出的目标预取解码输出向量;

49、计算所述正预取样本和所述负预取样本与所述目标预取解码输出向量的第一输出损失;

50、若所述第一输出损失大于预设阈值,则更新所述初始预取解码器的参数,得到新的初始预取解码器,并将所述新的初始预取解码器作为所述初始预取解码器,返回执行将所述待解码预取嵌入向量输入所述初始预取解码器,得到所述初始预取解码器输出的目标预取解码输出向量,直至所述第一输出损失小于所述预设阈值;

51、若所述第一输出损失小于所述预设阈值,将所述初始预取解码器作为所述替换解码器。

52、可选地,所述利用所述训练样本集分别对初始预取解码器和初始替换解码器进行本文档来自技高网...

【技术保护点】

1.一种缓存数据处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的缓存数据处理方法,其特征在于,所述获取缓存区中缓存数据的数据访问序列,包括:

3.根据权利要求1所述的缓存数据处理方法,其特征在于,所述对所述第一特征向量序列进行数据访问关联性的学习,得到文件系统中各访问数据的预取概率,包括:

4.根据权利要求3所述的缓存数据处理方法,其特征在于,所述基于所述预取概率,对所述访问数据进行预取处理之前,所述方法还包括:

5.根据权利要求4所述的缓存数据处理方法,其特征在于,所述解码器包括替换解码器和预取解码器,所述第一解码输出向量为预取解码输出向量,所述第二解码输出向量为替换解码输出向量;

6.根据权利要求5所述的缓存数据处理方法,其特征在于,所述将所述第一编码输出向量输入解码器,得到所述解码器输出的第一解码输出向量之前,所述方法还包括:

7.根据权利要求6所述的缓存数据处理方法,其特征在于,所述获取训练样本集,包括:

8.根据权利要求7所述的缓存数据处理方法,其特征在于,所述利用所述训练样本集分别对初始预取解码器和初始替换解码器进行训练,得到所述替换解码器和所述预取解码器,包括:

9.根据权利要求7所述的缓存数据处理方法,其特征在于,所述利用所述训练样本集分别对初始预取解码器和初始替换解码器进行训练,得到所述替换解码器和所述预取解码器,包括:

10.一种缓存数据处理装置,其特征在于,所述缓存数据处理装置包括:

11.一种缓存数据处理设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的缓存数据处理程序,所述缓存数据处理程序配置为实现如权利要求1至9中任一项所述的缓存数据处理方法的步骤。

12.一种存储介质,其特征在于,所述存储介质上存储有缓存数据处理程序,所述缓存数据处理程序被处理器执行时实现如权利要求1至9中任一项所述的缓存数据处理方法的步骤。

13.一种计算机程序产品,其特征在于,所述计算机程序产品包括缓存数据处理程序,所述缓存数据处理程序被处理器执行时实现如权利要求1至9中任一项所述的缓存数据处理方法的步骤。

...

【技术特征摘要】

1.一种缓存数据处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的缓存数据处理方法,其特征在于,所述获取缓存区中缓存数据的数据访问序列,包括:

3.根据权利要求1所述的缓存数据处理方法,其特征在于,所述对所述第一特征向量序列进行数据访问关联性的学习,得到文件系统中各访问数据的预取概率,包括:

4.根据权利要求3所述的缓存数据处理方法,其特征在于,所述基于所述预取概率,对所述访问数据进行预取处理之前,所述方法还包括:

5.根据权利要求4所述的缓存数据处理方法,其特征在于,所述解码器包括替换解码器和预取解码器,所述第一解码输出向量为预取解码输出向量,所述第二解码输出向量为替换解码输出向量;

6.根据权利要求5所述的缓存数据处理方法,其特征在于,所述将所述第一编码输出向量输入解码器,得到所述解码器输出的第一解码输出向量之前,所述方法还包括:

7.根据权利要求6所述的缓存数据处理方法,其特征在于,所述获取训练样本集,包括:

8.根据权利要求7所述的缓存数据处理方法,其...

【专利技术属性】
技术研发人员:尚晶肖智文武智晖王冀彬
申请(专利权)人:中移动信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1