【技术实现步骤摘要】
数据压缩方法、装置和系统
[0001]本公开涉及人工智能
,尤其涉及云计算、云存储、云网络和云数据库技术,可应用在智能云场景下,具体涉及一种数据压缩方法、装置和系统。
技术介绍
[0002]Append(追加)存储系统中经过长时间的使用后,会出现一些无效的空洞,即难以利用的存储空间,在这种情况下,为了避免Append系统中出现大片的无效的空洞,影响Append系统的性能,通常采用compaction(压缩)操作,将Append系统中的有效数据搬移到一起,从而可以得到大块的存储空间。
[0003]其次,压缩操作虽然可以提高Append系统的存储性能,但压缩操作会产生写放大的问题,同样会影响Append系统的存储性能。
技术实现思路
[0004]本公开提供了一种数据压缩方法、装置、系统、电子设备和存储介质。
[0005]根据本公开的第一方面,提供了一种数据压缩方法,包括:响应于数据压缩指令,确定所述数据压缩指令对应的待压缩数据;基于当前存储有所述待压缩数据的原始存储设备的原始存储空间,从多个存储设备的多个存储空间中确定所述待压缩数据对应的目标存储设备的目标存储空间,其中,所述多个存储设备的存储速度不同,所述多个存储空间至少包括用于存储不同访问频率数据的存储空间;将所述待压缩数据存储至所述目标存储设备的所述目标存储空间;释放所述原始存储设备的所述原始存储空间。
[0006]根据本公开的第二方面,提供了一种数据压缩装置,包括数据确定模块,用于响应于数据压缩指令,确定所述数据压缩指 ...
【技术保护点】
【技术特征摘要】
1.一种数据压缩方法,包括:响应于数据压缩指令,确定所述数据压缩指令对应的待压缩数据;基于当前存储有所述待压缩数据的原始存储设备的原始存储空间,从多个存储设备的多个存储空间中确定所述待压缩数据对应的目标存储设备的目标存储空间,其中,所述多个存储设备的存储速度不同,所述多个存储空间至少包括用于存储不同访问频率数据的存储空间;将所述待压缩数据存储至所述目标存储设备的所述目标存储空间;释放所述原始存储设备的所述原始存储空间。2.根据权利要求1所述的方法,其中,所述多个存储设备包括:第一存储设备和第二存储设备,所述第一存储设备包含热数据存储空间和冷数据存储空间,所述第二存储设备包含热数据存储空间、冷数据存储空间、第一数据存储空间和多个第二数据存储空间,其中,所述第一存储设备的存储速度大于所述第二存储设备的存储速度,所述第一数据存储空间和所述多个第二数据存储空间的数据来源不同,所述多个第二数据存储空间存储的数据对应的压缩时间不同。3.根据权利要求2所述的方法,其中,所述基于当前存储有所述待压缩数据的原始存储设备的原始存储空间,从多个存储设备的多个存储空间中确定所述待压缩数据对应的目标存储设备的目标存储空间包括:响应于所述原始存储空间为所述热数据存储空间,确定所述目标存储设备为所述第二存储设备,所述目标存储空间为所述第一数据存储空间;响应于所述原始存储空间为所述冷数据存储空间、所述第一数据存储空间或所述多个第二数据存储空间中的任意一个,确定所述目标存储设备为所述第二存储设备,并基于所述待压缩数据的压缩时间,从所述多个第二数据存储空间中确定所述目标存储空间。4.根据权利要求2所述的方法,其中,响应于所述数据压缩指令来自于所述第一存储设备,所述确定所述数据压缩指令对应的待压缩数据包括:遍历所述第一存储设备中的数据的反向索引,确定所述第一存储设备中的数据对应的第一索引信息;确定所述第一索引信息中的有效索引信息,其中,所述有效索引信息在所述反向索引中记录的偏移与正向索引中记录的偏移相同;确定与所述有效索引信息具有关联关系的关联索引信息;响应于所述关联索引信息对应的关联数据存储在所述第一存储设备中,将所述关联索引信息对应的关联数据和所述有效索引信息对应的有效数据进行合并,得到所述待压缩数据;响应于所述关联索引信息对应的关联数据未存储在所述第一存储设备中,确定所述待压缩数据为所述有效索引信息对应的有效数据。5.根据权利要求4所述的方法,其中,所述确定与所述有效索引信息具有关联关系的关联索引信息包括:获取与所述有效索引信息相邻的目标索引信息;响应于所述目标索引信息对应的数据存储于所述第一存储设备中,确定所述关联索引信息包含所述目标索引信息;
将所述目标索引信息作为所述有效索引信息,并重复执行获取所述目标索引信息,及响应于所述目标索引信息对应的数据存储于所述第一存储设备中,确定所述关联索引信息包含所述目标索引信息的步骤,直至所述目标索引信息对应的数据未存储于所述第一存储设备中。6.根据权利要求2所述的方法,其中,响应于所述数据压缩指令来自于所述第二存储设备,所述确定所述数据压缩指令对应的待压缩数据包括:确定所述数据压缩指令对应的待压缩数据段;遍历所述待压缩数据段的反向索引,确定所述待压缩数据段的对应的第二索引信息;获取所述第二存储设备中所述第二索引信息对应的数据,得到所述待压缩数据。7.根据权利要求1至6中任意一项所述的方法,还包括:接收来自于客户端的写数据请求,其中,所述写数据请求中携带有待存储数据;基于所述待存储数据的数据量和访问频率,从所述多个存储设备的所述多个存储空间中确定所述待存储数据对...
【专利技术属性】
技术研发人员:王大瑶,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。