数据分析方法及装置制造方法及图纸

技术编号:14760430 阅读:161 留言:0更新日期:2017-03-03 10:47
本发明专利技术公开了一种数据分析方法及装置,涉及信息技术领域,可以实现对数据进行规则匹配,可以提高数据规则匹配的效率。所述方法包括:将待匹配数据进行对象化处理;通过预先加载的代码片段,对处理后的数据进行规则匹配,所述代码片段中包含不同的预设规则,所述处理后的数据为与所述代码片段的编写语言对应的对象数据;根据匹配结果,确定是否执行与所述预设规则对应的预定操作。本发明专利技术适用于数据规则匹配分析。

【技术实现步骤摘要】

本专利技术涉及一种信息
,特别是涉及一种数据分析方法及装置
技术介绍
随着科学技术的不断发展,数据分析技术的应用越来越广泛。数据分析技术开始在互联网、零售、医疗、物联网等多个行业里成为商业变革的主导力量。数据分析技术是根据需要对网上海量的文本、图像和视频数据进行采集、分析、加工和利用的一项技术。目前,在数据分析过程中,有需要对数据进行规则匹配的需求。例如,当数据进行病毒查杀时,需要对该数据进行病毒规则匹配,以便根据匹配结果进行查杀操作。
技术实现思路
有鉴于此,本专利技术提供了一种数据分析方法及装置,主要目的在于可以实现对数据进行规则匹配,可以提高数据规则匹配的效率。依据本专利技术一个方面,提供了一种数据分析方法,该方法包括:将待匹配数据进行对象化处理;通过预先加载的代码片段,对处理后的数据进行规则匹配,所述代码片段中包含不同的预设规则,所述处理后的数据为与所述代码片段的编写语言对应的对象数据;根据匹配结果,确定是否执行与所述预设规则对应的预定操作。依据本专利技术另一个方面,提供了一种数据分析装置,该装置包括:处理单元,用于将待匹配数据进行对象化处理;匹配单元,用于通过预先加载的代码片段,对所述处理单元处理后的数据进行规则匹配,所述代码片段中包含不同的预设规则,所述处理后的数据为与所述代码片段的编写语言对应的对象数据;确定单元,用于根据所述匹配单元的匹配结果,确定是否执行与所述预设规则对应的预定操作。借由上述技术方案,本专利技术实施例提供的技术方案至少具有下列优点:本专利技术提供的一种数据分析方法及装置,首先将待匹配数据进行对象化处理;然后通过预先加载的代码片段,对处理后的数据进行规则匹配,所述代码片段中包含不同的预设规则,所述处理后的数据为与所述代码片段的编写语言对应的对象数据;最后根据匹配结果,确定是否执行与所述预设规则对应的预定操作。本专利技术通过预先加载的代码片段,将对象化处理后的数据进行规则匹配,可以实现对数据进行规则匹配,并且加载后的代码片段中保存有不同预设规则,进而可以实现将不同的预设规则预编译到内存中进行数据的规则匹配,当需要对大量数据进行规则匹配时,可以提高数据规则匹配的效率。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本专利技术实施例提供的一种数据分析方法流程示意图;图2示出了本专利技术实施例提供的另一种数据分析方法流程示意图;图3示出了本专利技术实施例提供的一种数据分析装置结构示意图;图4示出了本专利技术实施例提供的另一种数据分析装置结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。本专利技术实施例提供了一种数据分析方法,如图1所示,所述方法包括:101、将待匹配数据进行对象化处理。其中,所述待匹配数据可以为json数据、XML(ExtensibleMarkupLanguage,可扩展标记语言)数据等。例如,将待匹配的json数据进行对象化处理,得到Python(计算机程序设计语言)对象,以便通过Python语言编写的代码片段,对其进行规则匹配。102、通过预先加载的代码片段,对处理后的数据进行规则匹配。其中,所述代码片段中包含不同的预设规则,所述预设规则可以根据实际需求进行配置。所述处理后的数据为与所述代码片段的编写语言对应的对象数据。例如,该代码片段可以由技术人员事先利用Python语言进行编写配置,而对象化处理后的数据可以为Python对象数据。例如,预设规则的结构可以采取三段式:规则名,匹配条件、匹配结果,中间用特定符号分隔,一行一条规则;预设规则采取至上而下的原则,越靠前的规则越先匹配,整个匹配过程中只要命中一条规则就表明匹配成功并立即返回匹配结果。其中,匹配条件可以支持任意待匹配数据,直接取对象化处理后的待匹配数据做条件运算、逻辑运算等,如果结果为真,返回匹配结果,如果结果为假,继续下一条规则匹配。匹配条件、匹配结果均可支持正则匹配、自定义函数,以及Python语言本身的一些特性。对于本专利技术实施例,通过预先加载的代码片段进行规则匹配,加载后的代码片段中保存有不同预设规则,可以实现将不同的预设规则预编译到内存中进行数据的规则匹配,当需要对大量数据进行规则匹配时,可以提高数据规则匹配的效率。103、根据匹配结果,确定是否执行与预设规则对应的预定操作。其中,所述预定操作可以根据实际需求进行配置,例如,预定操作可以为返回字符串、获取json数据、修改原始json数据等操作。例如,预设规则为scan_by_powershell||data.cmdline.find(\powershell.exe\)>-1anddata.cmdline.find(\192.168.133.1\)>-1||\OK\,其中,该预设规则的规则名为scan_by_powershell,匹配条件为data.cmdline.find(\powershell.exe\)>-1anddata.cmdline.find(\192.168.133.1\)>-1,匹配成功后执行的预定操作是返回“OK”。当对象处理化后的待匹配数据与该预设规则匹配时,如cmdline里找到了\powershell.exe\字符串,则返回“OK”,作为执行与该预设规则对应的预定操作。本专利技术实施例提供的一种数据分析方法,首先将待匹配数据进行对象化处理;然后通过预先加载的代码片段,对处理后的数据进行规则匹配,所述代码片段中包含不同的预设规则,所述处理后的数据为与所述代码片段的编写语言对应的对象数据;最后根据匹配结果,确定是否执行与所述预设规则对应的预定操作。本专利技术通过预先加载的代码片段,将对象化处理后的数据进行规则匹配,可以实现对数据进行规则匹配,并且加载后的代码片段中保存有不同预设规则,进而可以实现将不同的预设规则预编译到内存中进行数据的规则匹配,当需要对大量数据进行规则匹配时,可以提高数据规则匹配的效率。具体地,本专利技术实施例提供了另一种数据分析方法,如图2所示,所述方法包括:201、按照待匹配数据对应的存储时间的先后顺序,从预设缓存队列中获取待匹配数据。其中,所述预设缓存队列中保存有不同的待匹配处理的数据。所述存储时间可以为待匹配数据存入预设缓存队列时的时间。对于本专利技术实施例,当需要处理大量的待匹配数据时,可以将这些数据存储在预先设置的缓存队列中等待处理,还可以应用在分布式系统中,例如,可以将不同机器需要处理的待匹配数据存储在预设缓存队列中等待处理。在本专利技术实施例中,可以按照待匹配数据存入预设缓存队列的时间的先后顺序,从预设缓存队列中获取待匹本文档来自技高网...
数据分析方法及装置

【技术保护点】
一种数据分析方法,其特征在于,包括:将待匹配数据进行对象化处理;通过预先加载的代码片段,对处理后的数据进行规则匹配,所述代码片段中包含不同的预设规则,所述处理后的数据为与所述代码片段的编写语言对应的对象数据;根据匹配结果,确定是否执行与所述预设规则对应的预定操作。

【技术特征摘要】
1.一种数据分析方法,其特征在于,包括:将待匹配数据进行对象化处理;通过预先加载的代码片段,对处理后的数据进行规则匹配,所述代码片段中包含不同的预设规则,所述处理后的数据为与所述代码片段的编写语言对应的对象数据;根据匹配结果,确定是否执行与所述预设规则对应的预定操作。2.根据权利要求1所述的数据分析方法,其特征在于,所述代码片段中保存的预设规则按照处理优先级的先后顺序排列,所述通过预先加载的代码片段,对处理后的数据进行规则匹配包括:按照所述排列的先后顺序,对处理后的数据依次进行规则匹配;所述根据匹配结果,确定是否执行与所述预设规则对应的预定操作包括:当存在一个预设规则与所述处理后的数据匹配成功时,则确定执行与所述匹配成功的预设规则对应的预定操作。3.根据权利要求1所述的数据分析方法,其特征在于,所述预设规则中包含规则标识信息、匹配条件信息及匹配结果信息,所述匹配结果信息中包含规则匹配成功时执行的预定操作信息,所述根据匹配结果,确定是否执行与所述预设规则对应的预定操作包括:根据所述预定操作信息和匹配结果,确定是否执行与匹配成功的预设规则对应的预定操作。4.根据权利要求1所述的数据分析方法,其特征在于,所述通过预先加载的代码片段,对处理后的数据进行规则匹配之前,所述方法还包括:对所述代码片段进行安全处理;所述通过预先加载的代码片段,对处理后的数据进行规则匹配包括:通过安全处理后的代码片段,对处理后的数据进行规则匹配。5.根据权利要求4所述的数据分析方法,其特征在于,所述对所述代码片...

【专利技术属性】
技术研发人员:颜高权
申请(专利权)人:北京奇虎科技有限公司北京奇安信科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1