实例的压缩方法和装置、实例的解压方法和装置制造方法及图纸

技术编号:21658307 阅读:28 留言:0更新日期:2019-07-20 05:33
本说明书提供一种实例的压缩方法和装置、实例的解压方法和装置。其中,实例的压缩方法包括:获取待压缩实例的关键维度的标识信息;根据预设的分词规则,对所述关键维度的标识信息进行分词处理,得到多个分词单元;根据预设的分词编码库,从所述多个分词单元中确定出匹配的分词单元;对所述待压缩实例中的匹配的分词单元进行压缩编码,得到压缩后的实例。在本说明书实施例中,通过利用预设的分词编码库将实例中原本数据量相对较大的关键维度的标识信息以分词单元为单位进行压缩处理,减少了实例的数据量;并且由于压缩过程只对实例中的关键维度的标识信息进行压缩,保持了实例本身的数据结构,从而不会影响针对实例的数据处理。

Compression method and device for example, decompression method and device for example

【技术实现步骤摘要】
实例的压缩方法和装置、实例的解压方法和装置
本说明书属于互联网
,尤其涉及一种实例的压缩方法和装置、实例的解压方法和装置。
技术介绍
互联网领域中,在对业务系统上的业务调用情况进行检测与统计时,常常需要先采集得到业务系统中的不同服务器上记录、整理的各种类型的实例(实例为对应某一种类型的业务调用数据的集合);再将通过不同服务器获取得到的同一类型的实例进行聚合,根据聚合后的实例,统计指定的特征维度(例如某个调用模块或者某个调用参数等)在业务系统整体上的调用信息(例如在系统中所有服务器上累积被调用次数);进而可以根据上述调用信息,对业务系统上的业务调用是否正常进行分析判断。但是由于一个实例大多是包含有多个同一类型的业务调用数据的集合,会包含有大量的数据信息。所以,实例本身的数据量会相对较大。导致直接对实例进行数据处理往往需要消耗掉相对较多的内存资源,影响系统整体的处理效率。因此,亟需一种能减少实例的内存消耗、提高处理效率,但又不会影响后续针对实例的数据处理的压缩方法。
技术实现思路
本说明书目的在于提供一种实例的压缩方法和装置、实例的解压方法和装置,以既可以减少实例的内存消耗、提高处理效率,又不会影响后续针对实例的数据处理。本说明书提供的一种实例的压缩方法和装置、实例的解压方法和装置是这样实现的:一种实例的压缩方法,包括:获取待压缩实例的关键维度的标识信息;根据预设的分词规则,对所述关键维度的标识信息进行分词处理,得到多个分词单元;根据预设的分词编码库,从所述多个分词单元中确定出匹配的分词单元;对所述待压缩实例中的匹配的分词单元进行压缩编码,得到压缩后的实例。一种实例的解压方法,包括:提取待解压实例中的压缩码;根据预设的分词编码库,确定出所述压缩码对应的分词单元;根据所述压缩码对应的分词单元,对所述待解压实例中的压缩码进行解压还原,得到解压后的实例。一种实例的压缩装置,包括:获取模块,用于获取待压缩实例的关键维度的标识信息;分词模块,用于根据预设的分词规则,对所述关键维度的标识信息进行分词处理,得到多个分词单元;第一确定模块,用于根据预设的分词编码库,从所述多个分词单元中确定出匹配的分词单元;压缩模块,用于对所述待压缩实例中的匹配的分词单元进行压缩编码,得到压缩后的实例。一种实例的解压装置,包括:提取模块,用于提取待解压实例中的压缩码;第二确定模块,用于根据预设的分词编码库,确定出所述压缩码对应的分词单元;解压模块,用于根据所述压缩码对应的分词单元,对所述待解压实例中的压缩码进行解压还原,得到解压后的实例。一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现获取待压缩实例的关键维度的标识信息;根据预设的分词规则,对所述关键维度的标识信息进行分词处理,得到多个分词单元;根据预设的分词编码库,从所述多个分词单元中确定出匹配的分词单元;对所述待压缩实例中的匹配的分词单元进行压缩编码,得到压缩后的实例。一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现获取待压缩实例的关键维度的标识信息;根据预设的分词规则,对所述关键维度的标识信息进行分词处理,得到多个分词单元;根据预设的分词编码库,从所述多个分词单元中确定出匹配的分词单元;对所述待压缩实例中的匹配的分词单元进行压缩编码,得到压缩后的实例。本说明书提供的一种实例的压缩方法和装置、实例的解压方法和装置,由于通过利用预设的分词编码库将实例中原本数据量相对较大的关键维度的标识信息以分词单元为单位进行压缩编码,减少了实例本身包含的数据量;并且由于上述压缩过程只对实例中的关键维度的标识信息进行了压缩,保持了实例原本的数据结构,从而能既可以减少实例的内存消耗、提高处理效率,又不会影响后续针对实例的数据处理,达到降低资源占用量、提高数据处理性能的技术效果。附图说明为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是在一个场景示例中,应用本说明书实施例提供的实例的压缩方法的一种实施例的示意图;图2是在一个场景示例中,应用本说明书实施例提供的实例的压缩方法的一种实施例的示意图;图3是在一个场景示例中,应用本说明书实施例提供的实例的压缩方法的一种实施例的示意图;图4是在一个场景示例中,应用本说明书实施例提供的实例的压缩方法的一种实施例的示意图;图5是在一个场景示例中,应用本说明书实施例提供的实例的压缩方法的一种实施例的示意图;图6是本说明书实施例提供的实例的压缩方法的流程的一种实施例的示意图;图7是本说明书实施例提供的实例的解压方法的流程的一种实施例的示意图;图8是本说明书实施例提供的服务器的结构的一种实施例的示意图;图9是本说明书实施例提供的实例的压缩装置的结构的一种实施例的示意图;图10是本说明书实施例提供的实例的解压装置的结构的一种实施例的示意图。具体实施方式为了使本
的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。考虑到由于不同服务器记录、整理的实例大多会包含有大量的数据信息,导致实例本身数据量相对较为庞大。因此,在获取并根据不同服务器反馈的实例后,进行针对实例的数据处理(例如针对某个调用模块的调用信息的统计分析)势必会消耗掉相对较多的内存资源,影响系统整体的处理效率。而常见的压缩方法往往是直接对实例全部进行压缩,这样得到的压缩后的实例通常不再具有原来的数据结构。导致后续无法直接对这种压缩后的实例进行具体的数据处理。正是注意到上述问题,本说明书考虑后续针对实例的数据处理往往是需要根据实例原本的数据结构,进行诸如聚合、统计等类型的数据处理。进一步的,又考虑到实例中的许多特征维度的标识信息(例如输入参数的数据信息、上游系统的信息等等)往往涉及的内容较多,数据量相对较大。且在同一个实例中,上述标识信息还会多次出现,进一步增加实例所包含的数据量。此外,在许多针对实例的数据处理,并不关注上述标识信息所表征的具体内容。基于上述分析和考虑,本说明书提供了一种更有针对性的实例压缩方法,可以预先建立一个预设的分词编码库,进而可以利用上述预设的分词编码库将实例中原本数据量相对较大的关键维度的标识信息以分词单元为单位进行压缩编码,减少了实例的数据量;同时由于上述压缩过程只对实例中的关键维度的标识信息进行压缩,不会改变实例本身的数据结构,即保持了实例本身的数据结构,从而能够在减少实例的内存消耗、提高处理效率的同时,又不会影响后续针对实例的数据处理。本说明书实施方式提供一种实例的压缩方法,所述实例的压缩方法可以应用于包含有服务器的监控系统中。具体实施时,上述服务器可以获取得到业务系统中不同服务器自行记录、整理的实例,再按照以下程序对所获取的实例进行压缩处本文档来自技高网
...

【技术保护点】
1.一种实例的压缩方法,包括:获取待压缩实例的关键维度的标识信息;根据预设的分词规则,对所述关键维度的标识信息进行分词处理,得到多个分词单元;根据预设的分词编码库,从所述多个分词单元中确定出匹配的分词单元;对所述待压缩实例中的匹配的分词单元进行压缩编码,得到压缩后的实例。

【技术特征摘要】
1.一种实例的压缩方法,包括:获取待压缩实例的关键维度的标识信息;根据预设的分词规则,对所述关键维度的标识信息进行分词处理,得到多个分词单元;根据预设的分词编码库,从所述多个分词单元中确定出匹配的分词单元;对所述待压缩实例中的匹配的分词单元进行压缩编码,得到压缩后的实例。2.根据权利要求1所述的方法,所述关键维度的标识信息包括以下至少之一:关键参数的参数信息、上游系统的名称、下游系统的名称。3.根据权利要求1所述的方法,所述预设的分词编码库按照以下方式建立:获取多个实例作为样本实例;从所述样本实例中提取关键维度的标识信息,作为样本标识信息;根据预设的分词规则,对所述样本标识信息进行分词处理,得到多个样本分词单元;根据预设的编码规则,确定样本分词单元对应的压缩码;根据所述样本分词单元和与所述样本分词单元对应的压缩码,建立所述预设的分词编码库。4.根据权利要求3所述的方法,根据预设的编码规则,确定样本分词单元对应的压缩码,包括:统计所述样本分词单元在所述样本实例中的出现频率;根据所述样本分词单元在样本实例中的出现频率,确定样本分词单元对应的压缩码。5.根据权利要求4所述的方法,根据所述样本分词单元在样本实例中的出现频率,确定样本分词单元对应的压缩码,包括:根据所述样本分词单元在样本实例中的出现频率,确定所述样本分词单元对应的压缩码的长度;根据所述样本分词单元对应的压缩码的长度,生成用于指示样本分词单元的字符串,作为与所述样本分词单元对应的压缩码。6.根据权利要求4所述的方法,在根据所述样本分词单元在样本实例中的出现频率,确定所述样本分词单元对应的压缩码的长度之前,所述方法还包括:对所述样本分词单元在样本实例中的出现频率进行归一化处理。7.根据权利要求1所述的方法,在对所述待压缩实例中的匹配的分词单元进行压缩编码,得到压缩后的实例之后,所述方法还包括:从所述压缩后的实例中提取指定压缩码;根据所述指定压缩码和所述压缩后的实例,进行调用信息的统计。8.一种实例的解压方法,包括:提取待解压实例中的压缩码;根据预设的分词编码库,确定出所述压缩码对应的分词单元;根据所述压缩码对应的分词单元,对所述待解压实例中的压缩码进行解压还原,得到解压后的实例。9.一种实例的压缩装置,包括:获取模块,用于获取待压缩实例的关键维度的标识信息;分词模块,用于根据预设的分词规则,对所述关键...

【专利技术属性】
技术研发人员:王少华
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1