一种运维操作指令安全分析方法、系统及存储介质技术方案

技术编号:25480478 阅读:17 留言:0更新日期:2020-09-01 23:01
本发明专利技术公开了一种运维操作指令安全分析方法、系统及存储介质,方法包括以下步骤:一)读取历史操作指令数据,对历史操作指令数据的字符集进行字符向量化处理;二)将向量化后的操作指令数据作为输入,建立神经网络模型,形成操作指令数据的网状关系图;三)对网状关系图中的操作指令字符数据进行数据降维处理;四)数据降维处理完毕后进行数据聚类处理;五)根据实际的业务场景对步骤四聚类后的运维指令数据集进行黑白灰名单的定义和整理,形成输出数据,将所有黑白灰名单输出数据写入指定数据库中。本发明专利技术解决了运维操作指令安全分析过程中难以人工标注类别且标注过于繁琐等问题,提高了运维操作指令安全分析自动化程度。

【技术实现步骤摘要】
一种运维操作指令安全分析方法、系统及存储介质
本专利技术涉及一种运维操作指令安全分析方法,属于电力系统运维操作的过程中操作指令安全性分析

技术介绍
近年来,随着中国制造2025国家新型战略转型提出的“智能制造”,数据信息的智慧化、智能化处理成为目前主流的研究方向。在国家电网公司电力系统的实际运营过程中,以及其营销策略更加系统性,科学性和可操作性的背景之下。企业运营在电子商务和实际操作信息采集等方面加强了大数据的研究,各大主流网络平台,电子商务对用户行为的大数据研究尤为显著,例如应用K-means的方法,展开对用户行为的单因素活多因素概率分析和属性分析,同机器学习的方法横向对比,选择其中最合适的数据处理方法。另外随着智能手机的普及,移动APP已经成为日常生活中必不可少的一部分,大数据分析可以对提升用户服务质量,分析用户需求和行为特征分析等,成为处理用户特征的另一种可行的方法。在处理IPTV视频用户行为的过程中,机器学习中的DNN深度学习方法可以更好的处理复杂性和多样性的大数据信息,并且达到数据收敛快,分类准确度高等优点。同时,网络教育平台在课程资源推送上,利用互联网和信息化的机器学习技术,建立用户画像,分析用户,并且提供用户提供合适的课程资源。随着机器学习中自然语言处理(NLP)及其工具包的应用,及数据挖掘,尤其是对于文字或操作代码指令的大数据挖掘方式能够得到较好的结果。人工智能与自然语言处理(NLP)的结合可以有效的实现语音控制智能家居,同时也可以将用户分类,对安全操作等进行有效的数据分析。在以上技术及方法的背景之下,有关运维操作指令的采集和录用,实现用户行为特征提取及安全预警建模成为可能,特别是对其中的用户异常行为的感知和预警,对于提升整个系统的安全防护等级具有十分关键的作用和积极的意义。而在云计算和大数据平台的环境下,用户实体行为分析(UEBA)可以分析大量日志并加强用户的异常行为安全审计。讨论运维操作来确定用户行为和系统安全,主要需分析安全事件从传统攻防转向侧重于数据泄露、数据篡改等事件的外部威胁检测。UEBA技术与解决方案的比较,也充分考虑了多种场景下的用户异常和安全处理方法。运维操作指令是操作Linux系统的用户实体行为分析的核心部分,在电力系统运维操作的过程中操作指令安全性分析的过程中,存在操作指令安全性分析难以人工标注类别且人工标注类别过于繁琐等方面的问题,虽然许多行业专家与学者们都曾按照实际项目的经验及不同技术层面来定义和分析在不同环境下的运维操作指令,但目前没有一种通用并且完善的方法来处理和定义诸多指令集,运维操作指令安全分析技术仍有待长期的探索、深化研究。
技术实现思路
本专利技术所要解决的技术问题是:运维操作指令安全分析过程中难以人工标注类别且标注过于繁琐。为解决上述技术特征,本专利技术提供一种的运维操作指令安全分析方法,包括以下步骤:步骤一,读取历史操作指令数据,对历史操作指令数据的字符集进行字符向量化处理;步骤二,将向量化后的操作指令数据作为输入,建立神经网络模型,形成操作指令数据的网状关系图;步骤三,对网状关系图中的操作指令字符数据进行数据降维处理;步骤四,数据降维处理完毕后进行数据聚类处理;步骤五,输出数据:根据实际的业务场景对步骤四聚类后的运维指令数据集进行黑白灰名单的定义和整理,形成输出数据。一种运维操作指令安全分析系统,包括以下程序模块:向量化程序模块:读取历史操作指令数据,对历史操作指令数据的字符集进行字符向量化处理;神经网络模型程序模块:将向量化后的操作指令数据作为输入,建立神经网络模型,形成操作指令数据的网状关系图;降维程序模块:对网状关系图中的操作指令字符数据进行数据降维处理;聚类程序模块:数据降维处理完毕后进行数据聚类处理;输出程序模块:根据实际的业务场景对步骤四聚类后的运维指令数据集进行黑白灰名单的定义和整理,形成输出数据。一种运维操作指令安全分析系统的存储介质,运行以下程序模块:向量化程序模块:读取历史操作指令数据,对历史操作指令数据的字符集进行字符向量化处理;神经网络模型程序模块:将向量化后的操作指令数据作为输入,建立神经网络模型,形成操作指令数据的网状关系图;降维程序模块:对网状关系图中的操作指令字符数据进行数据降维处理;聚类程序模块:数据降维处理完毕后进行数据聚类处理;输出程序模块:根据实际的业务场景对步骤四聚类后的运维指令数据集进行黑白灰名单的定义和整理,形成输出数据。本专利技术所达到的有益效果:本专利技术的方法及装置实现了对运维操作指令的安全分析、聚类及黑白灰名单分类,解决了运维操作指令安全分析过程中难以人工标注类别且标注过于繁琐等问题,提高了运维操作指令安全分析自动化程度,帮助电力监控系统识别非法操作,及时发现隐藏风险。本专利技术的运维操作指令安全分析方法在电力监控系统运维操作的场景下,以Linux系统运维操作指令为主的数据集为属性特征,运用主流网络平台对字符的大数据研究方法,利用机器学习中的无监督学习将运维操作指令与自然语言处理相结合,最终实现较好的分辨异常用户操作指令集和正常用户操作指令集的结果,建立运维操作指令相关的黑白名单,进而增强了系统安全。附图说明图1为用户运维操作令安全分析模型总体框架示意图;图2为自然语言处理(NLP)流程图;图3线性神经网络结构示意图;图4为t-SNE降维Local本地带参数操作指令数据结果示意图;图5为t-SNE降维SSH远程带参数操作指令数据示意图;图6为t-SNE降维Local本地带参数操作指令数据示意图;图7为t-SNE降维SSH远程带参数操作指令数据示意图;图8为PCA降维Local本地纯操作指令数据示意图。具体实施方式实施例1图1用户运维操作令安全分析模型总体框架示意图,在理论基础和设备运维操作的场景基础之上,构建用户运维操作指令安全分析模型,本专利技术的一种运维操作指令安全分析方法,包括下以步骤:步骤一,读取历史操作指令数据,对历史操作指令数据的字符集进行字符向量化处理;1)从指定数据库读取历史数据,分别为SSH(SecureShell的缩写,由IETF的网络工作小组(NetworkWorkingGroup)所制定,SSH为建立在应用层和传输层基础上的安全协议。)远程操作指令集(133142组指令数据)和Local本地操作指令集(8526组操作指令数据),所述操作指令数据为Linux系统正常操作的常用指令,如:ls,rm,vim等;2)在读入数据之后,对操作指令数据的字符集进行字符数据向量化处理,利用自然语言处理(NLP)中的独热编码(one-hotrepresentation)以及词向量(WordEmbedding)方法将字符数据数字化、向量化。自然语言处理(NLP)过程如图2所示,整个自然语言处理算法对字符文本的本文档来自技高网
...

【技术保护点】
1.一种运维操作指令安全分析方法,其特征在于,包括以下步骤:/n步骤一,读取历史操作指令数据,对历史操作指令数据的字符集进行字符向量化处理;/n步骤二,将向量化后的操作指令数据作为输入,建立神经网络模型,形成操作指令数据的网状关系图;/n步骤三,对网状关系图中的操作指令字符数据进行数据降维处理;/n步骤四,数据降维处理完毕后进行数据聚类处理;/n步骤五, 根据实际的业务场景对步骤四聚类后的运维指令数据集进行黑白灰名单的定义和整理,形成输出数据。/n

【技术特征摘要】
1.一种运维操作指令安全分析方法,其特征在于,包括以下步骤:
步骤一,读取历史操作指令数据,对历史操作指令数据的字符集进行字符向量化处理;
步骤二,将向量化后的操作指令数据作为输入,建立神经网络模型,形成操作指令数据的网状关系图;
步骤三,对网状关系图中的操作指令字符数据进行数据降维处理;
步骤四,数据降维处理完毕后进行数据聚类处理;
步骤五,根据实际的业务场景对步骤四聚类后的运维指令数据集进行黑白灰名单的定义和整理,形成输出数据。


2.根据权利要求1所述的运维操作指令安全分析方法,其特征在于:在所述步骤一中,历史操作指令数据包括SSH远程操作指令集和Local本地操作指令集。


3.根据权利要求1所述的运维操作指令安全分析方法,其特征在于:在所述步骤一中,利用自然语言处理中的独热编码以及词向量方法将字符数据向量化。


4.根据权利要求3所述的基于无监督学习的运维操作指令安全分析方法,其特征在于:
在字符数据向量化处理过程中,依次包括下述操作:
符号化;
句子和词的切词分割;
针对词性的标注;
字符和词的形态分析注释;
字符命名实体识别;
词相关的语法解析;
共指消解来识别不同关联字符文本中;
相同字符实体的不同标识符;
以及字符文本注释器。


5.根据权利要求1所述的运维操作指令安全分析方法,其特征在于:在步骤二中,选择并应用word2vec模型产生与词向量相关的双层浅神经网络模型。


6.根据权利要求5所述的运维操作指令安全分析方法,其特征在于:在word2vec模型的应有过程中,采用两个模型:词袋模型和跳词模型。


7.根据权利要求5所述的运维操作指令安全分析方法,其特征在于:在步骤三中,降维方法为主成分分析或t-分布领域嵌入算法。


8.根据权利要求1所述的运维操作指令安全分析方法,其特征在于:在步骤四中,聚类处...

【专利技术属性】
技术研发人员:梁野管荑高明慧王文婷张志军蒋正威高英健金学奇王昊刘勇王春艳刘新林琳马雷肖艳炜
申请(专利权)人:国家电网有限公司国网电力科学研究院有限公司南瑞集团有限公司国网山东省电力公司北京科东电力控制系统有限责任公司国网浙江省电力有限公司国网山东省电力公司电力科学研究院
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1