【技术实现步骤摘要】
一种缓存缺失率曲线的预测方法以及装置
[0001]本申请实施例涉及计算机领域,尤其涉及一种缓存缺失率曲线的预测方法以及装置。
技术介绍
[0002]缓存是一种位于两种速度相差较大的硬件之间用于协调两者数据传输速度差异的硬件结构。当多个应用程序共享固定大小的缓存空间时,由于各应用程序对缓存需求不同且随时间发生变化,如何动态分配合适的缓存空间给不同应用程序是提高系统整体性能的关键所在。
[0003]为了提高系统整体性能,计算设备通过缓存缺失率曲线(miss ratio curve,MRC)能够指示缓存空间的分配。在目前预测缺失率曲线的方案中,计算设备基于应用程序所要访问数据的重用距离预测缺失率曲线,由于基于重用距离的预测方法仅能够在最少最近使用(least recently used,LRU)缓存替换算法下准确预测缺失率曲线。当缓存采用其他的替换算法管理缓存中的数据时,基于重用距离的缺失率曲线预测方法预测准确率低。
[0004]因此,基于重用距离的缺失率曲线预测方法对于不同缓存的预测通用性差,对于非LRU替换算法的缓存预测缺失率曲线的准确率低。
技术实现思路
[0005]本申请实施例提供了一种缓存缺失率曲线的预测方法以及装置,用于提升缓存缺失率曲线的预测准确性。
[0006]本申请实施例第一方面提供了一种缓存缺失率曲线的预测方法,该方法可以由计算设备执行,也可以由计算设备的部件,例如计算设备的处理器、芯片或芯片系统等执行,还可以由能实现全部或部分计算设备功能的逻辑模块或软件实现。以 ...
【技术保护点】
【技术特征摘要】
1.一种缓存缺失率曲线的预测方法,其特征在于,包括:获取第一数据流的第一数据特征;将第一特征向量输入预测模型,得到第一缺失率曲线,所述预测模型包括机器学习模型;其中,所述第一缺失率曲线被用于确定第二数据流的缓存空间,所述第一数据流和所述第二数据流分别包括在两个不同的时段中应用程序的访问数据,所述第一特征向量通过对所述第一数据特征执行归一化操作后得到。2.根据权利要求1所述的方法,其特征在于,所述第一数据特征包括以下一项或多项:累计重用时间分布、重用率、频率分布或频率类特征,所述累计重用时间分布包括所述第一数据流中重复数据之间间隔的数据个数的累计分布,所述重用率包括所述第一数据流中重复数据与数据总个数的比值,所述频率分布包括所述第一数据流中数据的重复频率的分布,所述频率类特征包括所述频率分布中不同频率的个数。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:根据所述第一缺失率曲线确定所述第二数据流的缓存空间;将所述第二数据流缓存在所述缓存空间。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述第一数据流包括在第一时段中应用程序的访问数据,所述第二数据流包括在第二时段中应用程序的访问数据,所述第二时段在所述第一时段之后。5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:获取第三数据流;基于标签获取模块对所述第三数据流执行缓存分配操作,得到第二缺失率曲线的标签,所述标签获取模块用于模拟缓存的数据替换算法生成所述第二缺失率曲线的标签;根据所述第三数据流和所述第二缺失率曲线的标签训练所述预测模型。6.根据权利要求5所述的方法,其特征在于,所述根据所述第三数据流和所述第二缺失率曲线的标签训练所述预测模型包括:构建预测模型;获取所述第三数据流的第二数据特征;将所述第二特征向量输入所述预测模型,得到第二缺失率曲线,所述第二特征向量通过对所述第一数据特征执行归一化操作得到;根据所述第二缺失率曲线和所述第二缺失率曲线的标签计算得到所述预测模型的损失函数;基于所述损失函数调整所述预测模型的参数得到所述预测模型。7.根据权利要求6所述的方法,其特征在于,所述预测模型包括输入层、隐藏层和输出层,所述基于所述损失函数更新所述预测模型包括:基于所述损失函数更新所述预测模型每一层的权重参数和偏置参数。8.根据权利要求5至7中任一项所述的方法,其特征在于,所述第三数据流包括训练数据流和测试数据流,所述训练数据流用于训练所述预测模型,所述测试数据流用于测试训练完成的预测模型。9.一种缓存缺失率曲线的预测装置,其特征在于,包括:获取单元,用于获取第一数据流的第一数据特征;
处理单元,用于将第一特征向量输入预测模型,得到第一缺失率曲线,所述预测模型包括机器学习模型;其中,所述第一缺失率曲线被用于确定第二数据流的缓存空...
【专利技术属性】
技术研发人员:顾怡斌,王桦,周可,方维,胡刚,程卓,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。