日志文本的处理方法、装置、电子设备及计算机存储介质制造方法及图纸

技术编号:24995723 阅读:19 留言:0更新日期:2020-07-24 17:58
本申请提供了一种日志文本的处理方法、装置、电子设备及计算机存储介质,该方法包括:监听系统是否生成原始日志文本;若监听到所述系统生成原始日志文本,则获取所述原始日志文本,并按照预设的压缩算法将所述原始日志文本转换为压缩日志文本;其中,所述压缩日志文本包括多个字符串;构造所述压缩日志文本的索引结构,得到具有索引结构的目标日志文本;对所述目标日志文本进行归档处理。

【技术实现步骤摘要】
日志文本的处理方法、装置、电子设备及计算机存储介质
本专利技术涉及数据处理
,尤其涉及到一种日志文本的处理方法、装置、电子设备及计算机存储介质。
技术介绍
随着互联网科技的高速发展,互联网成了当下热门领域。当企业或用户频繁使用互联网技术时,大量的日志数据也随着产生;面对海量的日志数据,兼顾高效的搜索和归档的处理日志能力显得尤为重要。然现阶段,市面上存在的日志处理系统处理能力单一,或仅支持索引功能,或仅支持对日志数据进行压缩归档,无法做到二者兼顾。
技术实现思路
有鉴于此,本申请提供了一种日志文本的处理方法、装置、电子设备及计算机存储介质,以向用户提供一种兼顾日志文本压缩归档及快速索引的服务。为实现上述目的,本申请提供如下技术方案:本申请第一方面提供了一种日志文本的处理方法,包括:监听系统是否生成原始日志文本;若监听到所述系统生成原始日志文本,则获取所述原始日志文本,并按照预设的压缩算法将所述原始日志文本转换为压缩日志文本;其中,所述压缩日志文本包括多个字符串;构造所述压缩日志文本的索引结构,得到具有索引结构的目标日志文本;对所述目标日志文本进行归档处理。可选的,所述监听系统是否生成原始日志文本,包括:按照预设的时间间隔监听所述系统是否产生原始日志文本。可选的,所述按照预设的压缩算法将所述原始日志文本转换为压缩日志文本,包括:利用块压缩算法BWT获取所述原始日志文本的转换模式;其中,所述转换模式包括重复模式;根据所述转换模式将所述原始日志文本转换为所述压缩日志文本。可选的,所述构造所述压缩日志文本的索引结构,得到具有索引结构的目标日志文本,包括:对所述压缩日志文本的多个字符串分别设置对应的编码,得到每一个所述字符串和对应的编码的对应关系;按照所述编码的顺序对所述多个字符串进行排序,得到具有索引结构的目标日志文本。可选的,所述对目标日志文本进行归档处理之后,还包括:当接收到对日志文本的索引指令时,确定所述索引指令携带的编码信息;依据所述编码信息查询得到所述编码信息对应的字符串;按照预设的逆映射方法,将所述字符串逆映射为所述原始日志文本中与所述字符串对应的子文本。本申请第二方面提供了一种日志文本的处理装置,包括:监听单元,用于监听系统是否生成原始日志文本;转换单元,用于若监听到所述系统生成原始日志文本,则获取所述原始日志文本,并按照预设的压缩算法将所述原始日志文本转换为压缩日志文本;其中,所述压缩日志文本包括多个字符串;构造单元,用于构造所述压缩日志文本的索引结构,得到具有索引结构的目标日志文本;归档单元,用于对所述目标日志文本进行归档处理。可选的,所述监听单元,包括:监听子单元,用于按照预设的时间间隔监听所述系统是否产生原始日志文本。可选的,所述转换单元,包括:获取子单元,用于利用块压缩算法BWT获取所述原始日志文本的转换模式;其中,所述转换模式包括重复模式;转换子单元,用于根据所述转换模式将所述原始日志文本转换为所述压缩日志文本。可选的,所述构造单元,包括:设置子单元,用于对所述压缩日志文本的多个字符串分别设置对应的编码,得到每一个所述字符串和对应的编码的对应关系;排序子单元,用于按照所述编码的顺序对所述多个字符串进行排序,得到具有索引结构的目标日志文本。可选的,还包括:确定单元,用于当接收到对日志文本的索引指令时,确定所述索引指令携带的编码信息;查询单元,用于依据所述编码信息查询得到所述编码信息对应的字符串;逆映射单元,用于按照预设的逆映射方法,将所述字符串逆映射为所述原始日志文本中与所述字符串对应的子文本。本申请第三方面提供了一种电子设备,包括处理器和存储器;其中:所述存储器用于存储计算机指令;所述处理器用于执行所述存储器存储的计算机指令,具体执行如上述任意一项提供日志文本的处理方法。本申请第四方面提供了一种计算机存储介质,用于存储程序,所述程序被执行时,用于实现如上述的任意一项提供的日志文本的处理方法。与现有技术相比,本申请具有以下优点:本申请实施例提供的一种日志文本的处理方法中,监听系统是否生成原始日志文本;若监听到所述系统生成原始日志文本,则获取所述原始日志文本,并按照预设的压缩算法将所述原始日志文本转换为压缩日志文本;其中,所述压缩日志文本包括多个字符串;进而构造所述压缩日志文本的索引结构,得到具有索引结构的目标日志文本;最终,对所述目标日志文本进行归档处理。由此可见,应用本申请实施例提供的处理方法,能够基于原始日志文本构造出具备索引功能的压缩日志文本并进行归档,在归档之后,亦能根据构造的索引结构向用户提供对日志文本的索引功能,兼顾了对日志文本的高效的搜索和归档的能力,提升了业务效率。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术实施例提供的一种日志文本的处理方法的方法流程图;图2为本专利技术另一实施例提供的一种步骤S102的实现方法的方法流程图;图3为本专利技术另一实施例提供一种步骤S103的实现方法的方法流程图;图4为本专利技术另一实施例提供的一种索引方法的方法流程图;图5为本专利技术实施例提供的一种日志文本的处理装置的结构示意图;图6为本专利技术实施例提供的一种电子设备的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。需要说明的是,专利技术人在对现有技术的研究中发现,随着互联网应用的普及,用户在网络上所花费的时间越来越长,浏览新闻资讯,刷微博,写博客亦或进行商品交易,都使得系统每时每刻产生大量GB级甚至更庞大的行为日志数据。面对海量的日志数据,需要一种良好的处理方式,以兼顾对日志文本的高效搜索和归档能力。有鉴于此,本申请实施例提供了一种日志文本的处理方法,请参照图1所示,包括:本文档来自技高网...

【技术保护点】
1.一种日志文本的处理方法,其特征在于,包括:/n监听系统是否生成原始日志文本;/n若监听到所述系统生成原始日志文本,则获取所述原始日志文本,并按照预设的压缩算法将所述原始日志文本转换为压缩日志文本;其中,所述压缩日志文本包括多个字符串;/n构造所述压缩日志文本的索引结构,得到具有索引结构的目标日志文本;/n对所述目标日志文本进行归档处理。/n

【技术特征摘要】
1.一种日志文本的处理方法,其特征在于,包括:
监听系统是否生成原始日志文本;
若监听到所述系统生成原始日志文本,则获取所述原始日志文本,并按照预设的压缩算法将所述原始日志文本转换为压缩日志文本;其中,所述压缩日志文本包括多个字符串;
构造所述压缩日志文本的索引结构,得到具有索引结构的目标日志文本;
对所述目标日志文本进行归档处理。


2.根据权利要求1所述的处理方法,其特征在于,所述监听系统是否生成原始日志文本,包括:
按照预设的时间间隔监听所述系统是否产生原始日志文本。


3.根据权利要求1所述的处理方法,其特征在于,所述按照预设的压缩算法将所述原始日志文本转换为压缩日志文本,包括:
利用块压缩算法BWT获取所述原始日志文本的转换模式;其中,所述转换模式包括重复模式;
根据所述转换模式将所述原始日志文本转换为所述压缩日志文本。


4.根据权利要求1所述的处理方法,其特征在于,所述构造所述压缩日志文本的索引结构,得到具有索引结构的目标日志文本,包括:
对所述压缩日志文本的多个字符串分别设置对应的编码,得到每一个所述字符串和对应的编码的对应关系;
按照所述编码的顺序对所述多个字符串进行排序,得到具有索引结构的目标日志文本。


5.根据权利要求4所述的处理方法,其特征在于,所述对目标日志文本进行归档处理之后,还包括:
当接收到对日志文本的索引指令时,确定所述索引指令携带的编码信息;
依据所述编码信息查询得到所述编码信...

【专利技术属性】
技术研发人员:文梦蝶
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1