【技术实现步骤摘要】
裁剪数据的方法、装置、计算机设备及存储介质
[0001]本专利技术涉及存储
,具体涉及裁剪数据的方法
、
装置
、
计算机设备及存储介质
。
技术介绍
[0002]在分布式文件系统中,一般是通过多线程单元进行业务处理
。
每个线程单元上缓存有很多数据,包括多个数据的主本和副本
。
一个数据在一个线程单元上只存在副本或只存在主本
。
[0003]线程单元为了保证自身的处理数据的能力,会按指定周期确定其缓存的数据当前占用的存储空间是否超过了预设阈值
。
如果是,线程单元会按数据的冷热规则
(
数据的业务使用次数从少到多
)
,对没有在业务处理中的副本
、
没有在业务处理中且副本数量为零的主本进行扫描并裁剪,直到其缓存的数据当前占用的存储空间降低到预设阈值以下
。
这样,线程单元中副本数量不为零的主本无法被裁剪,只能等到相应副本所在的线程单元在按指定周期确定出其上缓存的数据当前占用的存储空间超过指定阈值时,才能对相应副本进行扫描和裁剪工作
。
线程单元只有在确定出主本对应的副本数量为零后,才能裁剪主本
。
[0004]这样,如果线程单元缓存的数据当前占用的存储空间长时间都没有超过预设阈值,那么其上的副本一直无法被裁剪,而该副本对应的主本也就无法被裁剪
。
进一步,导致该主本所在的线程单元无法及时释放内存, ...
【技术保护点】
【技术特征摘要】
1.
一种裁剪数据的方法,其特征在于,所述方法应用于分布式文件系统,所述方法由第一线程单元执行,所述第一线程单元为所述分布式文件系统中的任一线程单元,所述方法包括:当达到周期性的触发时刻时,根据所述第一线程单元自身缓存的数据当前占用的存储空间,确定裁剪规则;每遍历到目标类型的数据时,按所述裁剪规则确定对所述目标类型的数据是否进行裁剪操作,其中,所述目标类型的数据为未在业务处理中的副本或未在业务处理中且副本数量为零的主本
。2.
根据权利要求1所述的方法,其特征在于,所述方法还包括:每遍历到除所述目标类型之外的预设类型的数据,向所述预设类型的数据对应的副本所在的第二线程单元发送第一裁剪通知,其中,所述预设类型的数据为未在业务处理中且副本数量不为零的主本,所述第二线程单元为所述分布式存储系统中除所述第一线程单元之外的线程单元;当接收到所述第二线程单元发送的裁剪完成通知时,对所述预设类型的数据的副本数量进行更新
。3.
根据权利要求1所述的方法,其特征在于,所述根据所述第一线程单元自身缓存的数据当前占用的存储空间,确定裁剪规则,具体包括:确定所述第一线程单元自身缓存的数据当前占用的存储空间;当所述第一线程单元自身缓存的数据当前占用的存储空间大于或等于预设阈值时,获取第一裁剪规则;或者,当所述第一线程单元自身缓存的数据当前占用的存储空间小于所述预设阈值时,获取第二裁剪规则
。4.
根据权利要求3所述的方法,其特征在于,所述第一裁剪规则为裁剪所述目标类型的数据后所述第一线程单元自身缓存的数据占用的存储空间小于预设阈值,所述第二裁剪规则为确定所述第一线程单元裁剪的目录类型的数据的数量等于预设数量
。5.
根据权利要求4所述的方法,其特征在于,所述每遍历到目标类型的数据时,按所述裁剪规则确定对所述目标类型的数据是否进行裁剪操作,具体包括:每遍历到所述目标类型的数据时,确定所述第一线程单元自身缓存的数据当前占用的存储空间是否小于所述预设阈值;当所述第一线程单元自身缓存的数据当前占用的存储空间大于或等于所述预设阈值时,对所述目标类型的数据进行裁剪操作;并在对所述目标类型的数据进行裁剪操作后,重新确定所述第一线程单元自身缓存的数据占用的存储空间;当重新确定的所述第一线程单元自身缓存的数据占用的存储空间依然大于或者...
【专利技术属性】
技术研发人员:张思亮,李鹏,刘洪栋,
申请(专利权)人:济南浪潮数据技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。