用于文件的操作方法、电子设备及存储介质技术

技术编号:38558392 阅读:14 留言:0更新日期:2023-08-22 21:00
本公开的实施例提供了一种用于文件的操作方法、电子设备和计算机程序介质。该方法包括:响应于接收到请求,确定在第一时间间隔内的、与硬盘中的待操作的文件相关联的第一状态下执行第一操作的第一预测决策值和在该第一状态下执行第二操作的第二预测决策值,其中该第一操作和该第二操作与对该文件执行的合并操作相关。该方法还可以包括基于该第一预测决策值和该第二预测决策值,确定选择参考值,并且基于该选择参考值,从该第一操作或者该第二操作中选择一种操作,以用于对该文件进行合并操作。通过采用根据本公开实施例的方法,能够在对文件进行操作的时候实现提高的吞吐量,显著提升操作效率,还能够提高硬盘带宽利用率,并进一步提升用户体验。并进一步提升用户体验。并进一步提升用户体验。

【技术实现步骤摘要】
用于文件的操作方法、电子设备及存储介质


[0001]本公开总体上涉及计算机领域,并且更具体地涉及用于硬盘中的文件的操作方法、电子设备以及计算机存储介质。

技术介绍

[0002]硬盘是计算设备中的重要部件。硬盘中存储着各种数据,并且硬盘中的数据可以以文件的形式被存储。随着计算设备处理的数据量越来越多,硬盘上的文件数目也越来越多。在对硬盘中的众多文件进行查询操作的时候,如何实现期望的较高的吞吐量成为用户关心的重要问题。

技术实现思路

[0003]根据本公开的示例实施例,提供了一种用于硬盘中的文件的操作方法、电子设备以及计算机存储介质。
[0004]在本公开的第一方面,提供了一种用于文件的操作方法,包括:响应于接收到请求,确定在第一时间间隔内的、与硬盘中的待操作的文件相关联的第一状态下执行第一操作的第一预测决策值和在该第一状态下执行第二操作的第二预测决策值,其中该第一操作和该第二操作与对该文件执行的合并操作相关。该方法还可以包括基于该第一预测决策值和该第二预测决策值,确定选择参考值,并且基于该选择参考值,从该第一操作或者该第二操作中选择一种操作,以用于对该文件进行合并操作。
[0005]在本公开的第二方面,提供了一种电子设备,包括:至少一个处理单元;至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令,该指令当由至少一个处理单元执行时使得电子设备执行根据本公开的第一方面所描述的方法。
[0006]在本公开的第三方面,提供了一种计算机可读存储介质,该计算机可读存储介质具有在其上存储的机器可执行指令,该机器可执行指令在由设备执行时使该设备执行根据本公开的第一方面所描述的方法。
[0007]本公开的第四方面,提供了一种计算机程序产品,包括计算机可执行指令,其中计算机可执行指令在被处理器执行时实现根据本公开的第一方面所描述的方法。
[0008]提供
技术实现思路
部分是为了以简化的形式来介绍一系列概念,它们在下文的具体实施方式中将被进一步描述。
技术实现思路
部分不旨在标识本公开的关键特征或必要特征,也不旨在限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
[0009]结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标注表示相同或相似的元素,其中:
[0010]图1示出了本公开的实施例能够在其中被实现的示例系统的示意图;
[0011]图2示出了根据本公开实施例的对文件进行操作的方法的流程图;
[0012]图3中示出根据本公开实施例的与文件相关联的用于确定决策值的计算指标;
[0013]图4示出根据本公开实施例的计算设备执行查询操作的示例性方法流程图;
[0014]图5示意出根据本公开实施例的用于计算资源的应用多阶段合并策略的示意性图示;
[0015]图6示出了根据本公开的一些实施例的示例装置的示意框图;以及
[0016]图7示出了可以用来实施本公开的实施例的示例设备的框图。
具体实施方式
[0017]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0018]随着硬盘中的文件数目越来越多,在对数量繁多的文件进行操作(例如,查询操作)的时候,合并文件可以减少查询的次数。然而现有的技术无法识别不同数据访问特征,因此,难以在不同时间和不同键值空间中实现较优的合并策略。如何充分利用数据访问特征,并自适应地选择合并策略,进而以期望的高的吞吐量获得查询结果是亟待解决的问题。
[0019]有鉴于此,本公开的实施例提供了一种用于文件的操作方法,包括:响应于接收到请求,确定在第一时间间隔内的、与硬盘中的待操作的文件相关联的第一状态下执行第一操作的第一预测决策值和在该第一状态下执行第二操作的第二预测决策值,其中该第一操作和该第二操作与对该文件执行的合并操作相关。该方法还可以包括基于该第一预测决策值和该第二预测决策值,确定选择参考值,并且基于该选择参考值,从该第一操作或者该第二操作中选择一种操作,以用于对该文件进行合并操作。通过采用根据本公开实施例的方法,能够充分利用数据的访问特征,自适应地在不同时间和键值空间中选择适当的合并策略,从而能够在对文件进行操作的时候实现提高的吞吐量,显著提升操作效率,还能够提高硬盘带宽利用率,并进一步提升用户体验。
[0020]图1示出了本公开的实施例能够在其中被实现的示例系统100的示意图。系统100中可以包括计算设备120。计算设备120中可以包括内存122以及硬盘124。此外,尽管没有示出,但本领域技术人员可理解的是,计算设备120还可以包括诸如处理器、输入输出设备等其他设备。
[0021]硬盘124上的数据可以按照一定的数据结构被存储在内存122和硬盘124中。例如,计算设备120可以采用日志结构合并树(LSM

tree)的数据结构将数据存储在内存122和硬盘124中。日志结构合并树是一种面向写入优化的数据结构,并被广泛应用于数据库存储引擎中,其提供键值对(key

value)的写入、删除、修改和查询功能。在采用日志结构合并树时,可以首先将数据写入并存储在内存122中。当数据量达到阈值(例如,由用户设定的阈值)后,计算设备120可以以有序文件序列的形式顺序地将数据持久化到硬盘124中。
[0022]日志结构合并树不断地合并硬盘124上的数据以提高硬盘124上的数据的有序性,进而提供良好的查询性能。日志结构合并树可以将硬盘124上的数据分层存储,并且数据每合并一次后就被写入下一层。例如,刚刚写入硬盘124的数据可以被存储在L0层,合并一次
后则被写入L1层,合并两次后被写入L2层,以此类推。
[0023]对硬盘124上的数据进行查询时,则先从L0层开始。计算设备120可以对每层的有序文件采用二分查找来搜索数据,直到查询到对应的键值时返回数据。在实际的应用环境中,通常会在多个计算设备上部署多个日志结构合并树实例,从而能够同时为用户提供服务。
[0024]在一些实施例中,计算设备120可以包括但不限于个人计算机、服务器计算机、手持或膝上型设备、移动设备(诸如移动电话、个人数字助理(PDA)、媒体播放器等)、车载设备、多处理器系统、消费电子产品、可穿戴电子设备、智能家居设备、小型计算机、大型计算机、边缘计算设备、包括上述系统或设备中的任意一个的分布式计算环境等。
[0025]在一些实施例中,计算设备120可以响应于接收到请求,确定在第一时间间隔内的、与硬盘124中的待操作的文件相关联的第一状态下执行第一操作的第一预测决策值和在第一状态下执行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于文件的操作方法,所述方法包括:响应于接收到请求,确定在第一时间间隔内的、与硬盘中的待操作的文件相关联的第一状态下执行第一操作的第一预测决策值和在所述第一状态下执行第二操作的第二预测决策值,其中所述第一操作和所述第二操作与对所述文件执行的合并操作相关;基于所述第一预测决策值和所述第二预测决策值,确定选择参考值;以及基于所述选择参考值,从所述第一操作或者所述第二操作中选择一种操作,以用于对所述文件进行合并。2.根据权利要求1所述的方法,其中所述文件按照日志结构合并树的结构被存储在所述硬盘中。3.根据权利要求1所述的方法,其中所述第一操作包括跳过执行合并操作,并且所述第二操作包括执行合并操作,当所述请求包括合并请求并且选择的所述操作包括所述第一操作时,所述方法还包括:跳过对所述文件的合并操作;以及用所述第一状态来更新第二时间间隔内的与所述文件相关联的第二状态,其中所述第二时间间隔与所述第一时间间隔相邻。4.根据权利要求1所述的方法,其中所述第一操作包括跳过执行合并操作,并且所述第二操作包括执行合并操作,当所述请求包括合并请求并且选择的所述一种操作包括所述第二操作时,所述方法还包括:对所述文件执行合并操作;以及基于所述合并操作,获取在第二时间间隔内的与所述文件相关联的第二状态,其中所述第二时间间隔与所述第一时间间隔相邻。5.根据权利要求1所述的方法,其中当所述请求包括查询请求时,所述方法还包括:确定在所述第一状态下的第一决策值和第二决策值,其中所述第一决策值与所述第一操作对应,并且所述第二决策值与所述第二操作对应。6.根据权利要求5所述的方法,所述方法还包括:确定与所述第一时间间隔之后的至少一个后续时间间隔分别相对应的至少一个度量值;以及基于所述至少一个度量值来更新所述第一决策值和所述第二决策值,以分别获得在所述第一状态下的更新后的第一决策值和更新后的第二决策值。7.根据权利要求6所述的方法,其中当在所述第一时间间隔与所述至少一个后续时间间隔中的最晚时间间隔之间不存在合并操作时,所述方法还包括:确定与所述至少一个后续时间间隔中的所述最晚时间间隔相关联的第三决策值,其中所述第三决策值与在所述最晚时间间隔内执行所述第二操作相关联;基于所述第三决策值确定针对所述第二操作的缺失收益值;以及基于所述至少一个度量值和所述缺失...

【专利技术属性】
技术研发人员:韩煜星陈立翔杨程程罗旋
申请(专利权)人:华东师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1