当前位置: 首页 > 专利查询>深圳大学专利>正文

一种数据读写行为推测方法、装置、存储介质及电子设备制造方法及图纸

技术编号:33851907 阅读:57 留言:0更新日期:2022-06-18 10:38
本发明专利技术公开了一种数据读写行为推测方法、装置、存储介质及电子设备,当预设多层段落式存储系统中对应的段落式数据节点的深度大于多层段落式存储系统的最小激活深度,在多层段落式存储系统中获取读写行为数据;按照预设区隔度对段落式数据节点进行划分,得到多个区隔;在每一个区隔内的读写行为数据中提取用于读写行为推测的特征数据并分离出用于读写行为推测的数据集;将每一个区隔内的特征数据和数据集输入目标推测模型进行计算并确定多层段落式存储系统中相应区隔内的数据的读写行为。该方法通过分离数据读写规律进行推测,实现了对应实际的读写场景下数据的自适应优化调整,解决了存储系统无法根据实际读写情况进行数据结构优化的问题。行数据结构优化的问题。行数据结构优化的问题。

【技术实现步骤摘要】
一种数据读写行为推测方法、装置、存储介质及电子设备


[0001]本专利技术涉及数据推测访问
,具体涉及一种数据读写行为推测方法、装置、存储介质及电子设备。

技术介绍

[0002]在互联网的产业高速发展的今天,随着用户数量和互联网应用的快速增长,互联网内所产生的音视频等多媒体数据以及商业领域的大量电子数据呈指数级增长,导致了行业内对存储性能的要求也越来越高。企业级存储系统以及新兴的区块链储存系统大量采用了树形结构作为存储系统的数据结构,以求获得更优的写入性能。然而,树形结构以牺牲读性能而提高写性能的优化思路在云存储与区块链存储的应用场景下,难以适应其对高读写性能的要求。目前的数据结构优化方法中,较为普遍的优化方法为将有序字符串表进行合并和下压,但是这种方法均无法对应实际的读写场景进行自适应优化调整,难以在云存储与区块链存储的应用下实现不同数据使用场景的稳定的高读写性能,导致存储系统无法根据实际读写情况进行数据结构优化。

技术实现思路

[0003]有鉴于此,本专利技术实施例提供了涉及一种数据读写行为推测方法、装置、存储介质及电子设备,以解决现有技术中存储系统无法根据实际读写情况进行数据结构优化的技术问题。
[0004]本专利技术提出的技术方案如下:
[0005]本专利技术实施例第一方面提供一种数据读写行为推测方法,该数据读写行为推测方法包括:当预设多层段落式存储系统中对应的段落式数据节点的深度大于所述多层段落式存储系统的最小激活深度,在所述多层段落式存储系统中获取读写行为数据;按照预设区隔度对段落式数据节点进行划分,得到多个区隔,其中所述区隔度用于表征根据固定键值跨度确定的存储区域中包含的段落式数据存储节点的数量;在每一个区隔内的读写行为数据中提取用于读写行为推测的特征数据并分离出用于读写行为推测的数据集;将每一个区隔内的所述特征数据和所述数据集输入目标推测模型得到所述多层段落式存储系统中相应区隔内的数据对应的切割行为的第一概率和对应的保持行为的第二概率;根据所述第一概率和所述第二概率确定所述多层段落式存储系统中相应区隔内的数据的读写行为。
[0006]可选地,将每一个区隔内的所述特征数据和所述数据集输入目标推测模型得到所述多层段落式存储系统中相应区隔内的数据对应的切割行为的第一概率和对应的保持行为的第二概率,包括:将所述特征数据输入目标推测模型计算得到包含所述目标推测模型选择所述切割行为的第一初始概率和所述目标推测模型选择所述保持行为的第二初始概率的数据集;根据预设归一化函数对所述第一初始概率和所述第二初始概率进行归一化处理得到对应的所述第一概率和所述第二概率。
[0007]可选地,根据所述第一概率和所述第二概率确定所述多层段落式存储系统中相应
区隔内的数据的读写行为,包括:根据所述第一概率和所述第二概率对数据读写行为优先级进行排序;根据排序结果选择所述多层段落式存储系统中相应区隔度内的数据的读写行为。
[0008]可选地,在每一个区隔内的读写行为数据中分离出用于读写行为推测的数据集,包括:根据下式函数生成对应的数据集:
[0009][0010][0011]式中,ValidationSet[k]表示第k个区隔内的数据集;IORatio[k]表示第k个区隔内的总读写行为统计数据之和与所有区隔内的总读写行为统计数据之和的比率;BlockData[k]表示第k个区隔。
[0012]可选地,根据排序结果选择所述多层段落式存储系统中相应区隔度内的数据的读写行为,包括:根据下式确定第一随机值和第二随机值:
[0013]p1=ranNum(0.75,0.85)
[0014]p2=ranNum(ranNum(0.75,0.9)*(1

p1),1

p1)
[0015]式中,p1表示第一随机值;p2表示第二随机值;
[0016]通过下式获取随机数:
[0017][0018][0019]式中,表示随机数;
[0020]当在所述切割行为和所述保持行为中随机选择任意一种行为;当选择执行第二优先级对应的读写行为;当选择执行第一优先级对应的读写行为。
[0021]可选地,根据所述第一概率和所述第二概率确定所述多层段落式存储系统中相应区隔内的数据的读写行为之后,所述方法还包括:当确定所述多层段落式存储系统中相应区隔内的数据的读写行为是切割行为,确定待切割段落式数据节点;对所述待切割段落式数据节点对应的初始数据进行计算并得到新的段落式数据节点对应的数据;根据所述数据对所述待切割段落式数据节点进行切割。
[0022]本专利技术实施例第二方面提供一种数据读写行为推测装置,该数据读写行为推测装置包括:获取模块,用于当预设多层段落式存储系统中对应的段落式数据节点的深度大于所述多层段落式存储系统的最小激活深度,在所述多层段落式存储系统中获取读写行为数据;划分模块,用于按照预设区隔度对段落式数据节点进行划分,得到多个区隔,其中所述区隔度用于表征根据固定键值跨度确定的存储区域中包含的段落式数据存储节点的数量;处理模块,用于在每一个区隔内的读写行为数据中提取用于读写行为推测的特征数据并分离出用于读写行为推测的数据集;传输模块,用于将每一个区隔内的所述特征数据和所述
数据集输入目标推测模型得到所述多层段落式存储系统中相应区隔内的数据对应的切割行为的第一概率和对应的保持行为的第二概率;确定模块,用于根据所述第一概率和所述第二概率确定所述多层段落式存储系统中相应区隔内的数据的读写行为。
[0023]可选地,所述装置还包括:第一计算模块,用于将所述特征数据输入目标推测模型计算得到包含所述目标推测模型选择所述切割行为的第一初始概率和所述目标推测模型选择所述保持行为的第二初始概率的数据集;第一处理模块,用于根据预设归一化函数对所述第一初始概率和所述第二初始概率进行归一化处理得到对应的所述第一概率和所述第二概率。
[0024]本专利技术实施例第三方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行如本专利技术实施例第一方面及第一方面任一项所述的数据读写行为推测方法。
[0025]本专利技术实施例第四方面提供一种电子设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行如本专利技术实施例第一方面及第一方面任一项所述的数据读写行为推测方法。
[0026]本专利技术提供的技术方案,具有如下效果:
[0027]本专利技术实施例提供的数据读写行为推测方法,当预设多层段落式存储系统中对应的段落式数据节点的深度大于所述多层段落式存储系统的最小激活深度,在所述多层段落式存储系统中获取读写行为数据;按照预设区隔度对段落式数据节点进行划分,得到多个区隔,其中所述区隔度用于表征根据固定键值跨度确定的存储区域中包含的段落式数据存储节点的数量;在每一个区隔内的读写行为数据中提取用于读写行为推测的特征数据并分离出用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据读写行为推测方法,其特征在于,包括如下步骤:当预设多层段落式存储系统中对应的段落式数据节点的深度大于所述多层段落式存储系统的最小激活深度,在所述多层段落式存储系统中获取读写行为数据;按照预设区隔度对段落式数据节点进行划分,得到多个区隔,其中所述区隔度用于表征根据固定键值跨度确定的存储区域中包含的段落式数据存储节点的数量;在每一个区隔内的读写行为数据中提取用于读写行为推测的特征数据并分离出用于读写行为推测的数据集;将每一个区隔内的所述特征数据和所述数据集输入目标推测模型得到所述多层段落式存储系统中相应区隔内的数据对应的切割行为的第一概率和对应的保持行为的第二概率;根据所述第一概率和所述第二概率确定所述多层段落式存储系统中相应区隔内的数据的读写行为。2.根据权利要求1所述的方法,其特征在于,将每一个区隔内的所述特征数据和所述数据集输入目标推测模型得到所述多层段落式存储系统中相应区隔内的数据对应的切割行为的第一概率和对应的保持行为的第二概率,包括:将所述特征数据输入目标推测模型计算得到包含所述目标推测模型选择所述切割行为的第一初始概率和所述目标推测模型选择所述保持行为的第二初始概率的数据集;根据预设归一化函数对所述第一初始概率和所述第二初始概率进行归一化处理得到对应的所述第一概率和所述第二概率。3.根据权利要求1所述的方法,其特征在于,根据所述第一概率和所述第二概率确定所述多层段落式存储系统中相应区隔内的数据的读写行为,包括:根据所述第一概率和所述第二概率对数据读写行为优先级进行排序;根据排序结果选择所述多层段落式存储系统中相应区隔度内的数据的读写行为。4.根据权利要求1所述的方法,其特征在于,在每一个区隔内的读写行为数据中分离出用于读写行为推测的数据集,包括:根据下式函数生成对应的数据集:根据下式函数生成对应的数据集:式中,ValidationSet[k]表示第k个区隔内的数据集;IORatio[k]表示第k个区隔内的总读写行为统计数据之和与所有区隔内的总读写行为统计数据之和的比率;BlockData[k]表示第k个区隔。5.根据权利要求3所述的方法,其特征在于,根据排序结果选择所述多层段落式存储系统中相应区隔度内的数据的读写行为,包括:根据下式确定第一随机值和第二随机值:p1=ranNum(0.75,0.85)p2=ranNum(ranNum(0.75,0.9)*(1

p1),1

p1)式中,p1表示第一随机值;p2表示第二随机值;
...

【专利技术属性】
技术研发人员:王天添董芸豪沈晨玙马晨琳周池毛睿王毅
申请(专利权)人:深圳大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1