一种数据压缩方法及装置制造方法及图纸

技术编号:23348764 阅读:29 留言:0更新日期:2020-02-15 05:44
本申请实施例提供了一种数据压缩方法及装置。所述方法包括:对索引库数据进行分析,从中选择目标数据;根据所述目标数据生成压缩配置文件;根据所述压缩配置文件对所述目标数据进行压缩。可以从索引库中选择冷数据或者规律业务数据作为目标数据。并根据目标数据的特点生成包括时间节点和压缩算法的压缩配置文件。同时本申请进一步包括了一种解压方法,针对规律业务数据可以提前进行解压,提高集群索引效率。通过高压缩率的压缩算法对这些数据进行压缩并有规律地解压缩,在保证索引集合可用性的同时尽可能大的降低了数据的磁盘占用,提高了数据的存储效率。

A data compression method and device

【技术实现步骤摘要】
一种数据压缩方法及装置
本申请涉及数据处理领域,尤其涉及一种数据压缩方法及装置。
技术介绍
当前,随着计算机技术的发展,数据搜索的要求也越来越高。其中,solr云是一种分布式搜索方案,是一个高性能,采用Java开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。,可以实现企业级的数据搜索。可以处理大索引量,高并发的搜索请求。现有的solr集群系统中,可以将数据存储至服务器本地的数据库中。由于存储的数据量较大,因此solr数据存储可以自带LZ4压缩算法,将存储的本地数据压缩后进行存储,以节省存储空间。LZ4压缩算法具有压缩/解压速率较快的特点,在进行索引查询时可以快速响应查询请求。但是LZ4算法为了提高压缩速率,降低了算法的压缩率。即压缩后的数据依旧会占用较大的存储空间。
技术实现思路
有鉴于此,本申请实施例提供了一种数据压缩方法及装置,旨在对solr集本文档来自技高网...

【技术保护点】
1.一种数据压缩方法,其特征在于,所述方法包括:/n对索引库数据进行分析,从中选择目标数据;其中,所述目标数据包括冷数据和/或规律业务数据;冷数据为使用频率低于阈值的数据,所述规律业务数据的处理具有明确的时间规律。/n根据所述目标数据生成压缩配置文件;其中,所述压缩配置文件包括具有高压缩率的压缩算法;/n根据所述压缩配置文件对所述目标数据进行压缩。/n

【技术特征摘要】
1.一种数据压缩方法,其特征在于,所述方法包括:
对索引库数据进行分析,从中选择目标数据;其中,所述目标数据包括冷数据和/或规律业务数据;冷数据为使用频率低于阈值的数据,所述规律业务数据的处理具有明确的时间规律。
根据所述目标数据生成压缩配置文件;其中,所述压缩配置文件包括具有高压缩率的压缩算法;
根据所述压缩配置文件对所述目标数据进行压缩。


2.根据权利要求1所述的方法,其特征在于,所述压缩配置文件包括高压缩率的压缩算法压缩设定参数;所述压缩设定参数包括目标数据存储位置和压缩配置文件


3.根据权利要求2所述的方法,其特征在于,所述根据压缩配置文件对所述目标数据进行压缩包括:
在所述压缩时间节点触发压缩启动指令;
在所述压缩启动指令触发后,根据所述目标数据存储位置查找目标数据;
根据所述压缩算法对所述目标数据进行压缩。


4.根据权利要求3所述的方法,其特征在于,所述压缩配置文件还包括解压时间节点。


5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
在所述解压时间节点触发解压启动指令;...

【专利技术属性】
技术研发人员:侯满
申请(专利权)人:北京浪潮数据技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1