基于非完全子树核的命令聚类方法、装置、介质和设备制造方法及图纸

技术编号:40547825 阅读:29 留言:0更新日期:2024-03-05 19:05
本发明专利技术提供一种基于非完全子树核的命令聚类方法、装置、介质和设备,该方法包括:对命令日志进行词法和语法分析,将命令日志解析成抽象语法树的形式;构建所述抽象语法树的非完全子树空间,非完全子树空间包括所有抽象语法树的子树;根据非完全子树空间中的子树利用树核函数计算任意两颗抽象语法树之间的相似度值;根据相似度值采用密度聚类的方法对命令日志进行聚类。本发明专利技术实施例提供的一种基于非完全子树核方法的命令聚类技术,将命令解析成抽象语法树,并使用非完全子树核方法对抽象语法树进行相似度计算,使命令蕴含的语法规则能够被聚类模型所考虑在内,从而显著提高命令的聚类效果。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其涉及基于非完全子树核的命令聚类方法、装置、介质和设备


技术介绍

1、云计算场景下,云控制平台通常会将云主机运行的行为日志进行收集,这些日志大部分用来记录云主机所运行的命令,例如bash命令,以监控云主机的行为。云主机的所记录的bash命令数量通常十分庞大,这使得日志分析工作需要耗费巨大的人力成本和时间成本。对bash命令进行聚类可以对相似的云主机行为进行归类,使得实现云主机行为监控所需要处理的bash命令数量大幅降低。

2、传统的聚类方式将日志当成普通的文本,构建日志词表,使用向量空间模型对日志和命令进行数字化表示,然后应用机器学习或深度学习中的聚类模型对bash命令进行聚类。然而,bash命令是一种具有语法结构的数据,传统的方式不能考虑到bash命令的语法规则。


技术实现思路

1、有鉴于此,本专利技术实施例的目的在于提供一种基于非完全子树核的命令聚类方法、装置、介质和设备,以解决传统的聚类方式中不能考虑到命令的语法规则的技术问题。

2、为了达到上述目的,第本文档来自技高网...

【技术保护点】

1.一种基于非完全子树核的命令聚类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述的根据所述非完全子树空间中的子树利用树核函数计算任意两颗所述抽象语法树之间的相似度值,具体包括:

3.根据权利要求1所述的方法,其特征在于,所述的根据所述相似度值采用密度聚类的方法对所述命令进行聚类,具体包括:

4.根据权利要求3所述的方法,其特征在于,所述的根据所述第一阈值参数ε和所述第二阈值参数MinPts确定所述非完全子树空间的集合中的核心数据点,具体包括:

5.根据权利要求3所述的方法,其特征在于,所述的根据所述相似度值...

【技术特征摘要】

1.一种基于非完全子树核的命令聚类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述的根据所述非完全子树空间中的子树利用树核函数计算任意两颗所述抽象语法树之间的相似度值,具体包括:

3.根据权利要求1所述的方法,其特征在于,所述的根据所述相似度值采用密度聚类的方法对所述命令进行聚类,具体包括:

4.根据权利要求3所述的方法,其特征在于,所述的根据所述第一阈值参数ε和所述第二阈值参数minpts确定所述非完全子树空间的集合中的核心数据点,具体包括:

5.根据权利要求3所述的方法,其特...

【专利技术属性】
技术研发人员:陆瑾刘志伟王晓伟杨涛魏申平薛斌
申请(专利权)人:中国电子投资控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1