一种基于机器学习的终端接入数据异常检测方法及装置制造方法及图纸

技术编号:20451681 阅读:21 留言:0更新日期:2019-02-27 04:34
本发明专利技术提供一种基于机器学习的终端接入数据异常检测方法,包括:根据预先确定的多维特征库,处理接收到的当前终端接入数据,以获取每条接入数据的特征向量,其中,当前终端接入数据中包括至少一条接入数据;将获取的特征向量作为机器学习模型的输入信息,确定当前终端接入数据的检测结果,其中,该机器学习模型是预先训练并通过正确率测试的异常接入检测模型。该方法利用建立的异常接入检测模型检测终端接入数据的异常行为,保障了电、水、热、气热能源计量一体化采集系统的安全可靠运行。

【技术实现步骤摘要】
一种基于机器学习的终端接入数据异常检测方法及装置
本专利技术涉及信息安全
,具体涉及一种基于机器学习的终端接入数据异常检测方法及装置。
技术介绍
电、水、热、气热能源计量一体化采集系统存在多方面安全风险,为了保证采集数据传输安全,不仅需要对数据采取加密、网络隔离等安全防护方式,还需要从交换协议等层面检测接入数据中可能存在的恶意行为,如:数据篡改或植入恶意程序(木马、病毒、恶意代码等)。目前,电、水、热、气热能源计量一体化采集系统的安全风险控制水平较低,电、水、热、气热能源计量一体化采集系统难以在较高的安全水平下可靠运行。
技术实现思路
本专利技术提供一种基于机器学习的终端接入数据异常检测方法,以克服的目前能源计量一体化采集系统的安全水平不足,难以可靠运行的问题。第一方面,本专利技术提供了一种基于机器学习的终端接入数据异常检测方法,包括以下步骤:根据预先确定的多维特征库,处理接收到的当前终端接入数据,以获取每条接入数据的特征向量,其中,当前终端接入数据中包括至少一条接入数据;将获取的特征向量作为机器学习模型的输入信息,确定当前终端接入数据的检测结果,其中,该机器学习模型是预先训练并通过正确率测试的异常接入检测模型。进一步地,所述的方法,还包括:建立异常接入检测模型的步骤:从已存储终端接入数据中,根据协议规范解析每条接入数据的关键字段;根据协议规定及正常和异常报文的不同特点,提取每条接入数据的多维特征库;采用以上训练集,将特征向量作为输入,异常行为作为输出,采用机器学习分类算法,建立与多维特征库对应的的异常接入检测模型。进一步地,所述的方法,还包括:建立多维特征库的步骤:根据搜集的异常终端接入数据和搜集的正常终端接入数据,分别解析每条接入数据的特征向量;对比异常和正常终端接入数据中的各个字段的长度特征、各个字段的数量特征和不同异常行为的类型特征,获得异常终端接入数据的异常特征参数,并形成多维特征库。进一步地,所述的方法,在搜集训练集时,将特征向量完全相同的多条接入数据合并为一条接入数据。进一步地,所述的方法,在建立异常接入检测模型的步骤之后,还包括:获得待测试终端接入数据的特征向量,并利用该异常接入检测模型检测每条待测试终端接入数据,生成待测试终端接入数据对应地的检测结果;将所生成的检测结果与待测试终端接入数据的异常行为对比,获得该异常接入检测模型检测该待测试终端接入数据异常行为的正确率;判断正确率是否大于预设阈值;若是,则判定该异常接入检测模型有效;若否,则统计该异常接入检测模型针对多维特征库中每个特征参数的贡献度,并根据所统计的贡献度,重新执行建立异常接入检测模型的步骤。第二方面,本专利技术提供了一种基于机器学习的终端接入数据异常检测装置,包括:第一特征参数获得单元、检测结果获得单元、检测结果分析单元和第一检测结果生成单元;其中,第一特征参数获得单元,用于获得当前接入数据的特征参数;检测结果获得单元,用于以所获得的特征参数为预设的检测模型的输入信息,获得当前接入数据的检测结果,其中,检测结果用于表示当前接入数据包含异常行为的特征值;检测模型为针对特征参数的检测模型,检测模型在满足预设的更新条件的情况下,根据所获得的特征参数进行更新;检测结果分析单元,用于分析检测结果,判断当前接入数据是否包含异常行为,触发第一检测结果生成单元;第一检测结果生成单元,用于生成针对当前接入数据的异常检测结果。进一步地,所述的装置,还包括:接入数据获得单元、异常特征参数获得单元、接入数据合并单元、异常特征参数量化单元和检测模型建立单元;其中,接入数据获得单元,用于从已存储的接入数据中,获得带标记的接入数据作为训练数据集;异常特征参数获得单元,用于根据所获得的异常接入数据和正常接入数据,解析每条异常接入数据的异常特征参数,其中,异常特征参数为异常接入数据的特征参数;接入数据合并单元,用于将异常特征参数完全相同的接入数据合并为一条接入数据;异常特征参数量化单元,用于对合并后的每一条接入数据的异常特征参数进行量化处理;检测模型建立单元,用于根据预设的基于机器学习的分类算法,建立针对特征参数的检测模型。进一步地,所述的装置中,异常特征参数获得单元,包括:异常字段获得子单元、特征库确定子单元、特征向量获得子单元;其中,异常字段获得子单元,用于对比所获得的可用的异常接入数据和所获得的可用的正常接入数据中的各个字段,获得异常接入数据的异常字段;特征库确定子单元,用于根据异常字段、各个字段的长度特征、各个字段的数量特征和各个接入数据的类型特征,确定异常特征的多维特征库,其中,多维特征库,用于存储异常特征的异常特征参数;异常特征参数获得子单元,用于根据特征库中包含的异常特征参数,获得每条接入数据的特征向量。进一步地,所述的装置,还包括:第二特征向量获得单元、第二检测结果生成单元、正确率获得单元、正确率判断单元、成功判断单元和贡献度统计单元;其中,第二特征参数获得单元,用于获得待测试接入数据的特征向量;第二检测结果生成单元,用于根据检测模型和所获得的待测试接入数据的特征向量,检测每条待测试接入数据,并生成针对待测试接入数据的检测结果;正确率获得单元,用于根据所生成的各个检测结果,获得根据检测模型的接入数据检测正确率;正确率判断单元,用于判断正确率是否大于预设阈值,若为是,则触发成功判断单元,若为否,则触发贡献度统计单元;成功判断单元,用于判定建立检测模型成功;贡献度统计单元,用于统计检测模型中每个异常特征的贡献度,并根据所统计的贡献度,重新获得每条异常接入数据的异常特征向量,触发接入数据合并单元将异常特征参数完全相同的接入数据合并为一条接入数据。进一步地,所述的装置,还包括:类型判断单元和检测模型更新单元;其中,类型判断单元用于判断当前接入数据的类型是否为未知类型,若为是,则触发检测模型更新单元;检测模型更新单元,用于根据当前接入数据的类型更新检测模型。与现有技术相比,本专利技术提供的基于机器学习的终端接入数据异常检测方法,在原电、水、气、热能源计量一体化采集系统中已有的边界安全防护基础上,采用基于机器学习的“四表合一”终端接入数据异常检测方法,通过提取异常终端接入数据的特征向量,并利用机器学习算法建立异常接入检测模型,从而保障了电、水、热、气热能源计量一体化采集系统的安全可靠运行。附图说明通过参考下面的附图,可以更为完整地理解本专利技术的示例性实施方式:图1为本专利技术优选实施方式的基于机器学习的终端接入数据异常检测方法的流程示意图;图2为本专利技术优选实施方式的基于机器学习的终端接入数据异常检测装置的组成示意图;图3是本专利技术优选实施方式中基于机器学习的终端接入数据的异常检测方法示意图。具体实施方式现在参考附图介绍本专利技术的示例性实施方式,然而,本专利技术可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本专利技术,并且向所属
的技术人员充分传达本专利技术的范围。对于表示在附图中的示例性实施方式中的术语并不是对本专利技术的限定。在附图中,相同的单元/元件使用相同的附图标记。除非另有说明,此处使用的术语(包括科技术语)对所属
的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相本文档来自技高网
...

【技术保护点】
1.一种基于机器学习的终端接入数据异常检测方法,其特征在于,包括如下步骤:根据预先确定的多维特征库,处理接收到的当前终端接入数据,以获取每条接入数据的特征向量,其中,当前终端接入数据中包括至少一条接入数据;将获取的特征向量作为机器学习模型的输入信息,确定当前终端接入数据的检测结果,其中,该机器学习模型是预先训练并通过正确率测试的异常接入检测模型。

【技术特征摘要】
1.一种基于机器学习的终端接入数据异常检测方法,其特征在于,包括如下步骤:根据预先确定的多维特征库,处理接收到的当前终端接入数据,以获取每条接入数据的特征向量,其中,当前终端接入数据中包括至少一条接入数据;将获取的特征向量作为机器学习模型的输入信息,确定当前终端接入数据的检测结果,其中,该机器学习模型是预先训练并通过正确率测试的异常接入检测模型。2.如权利要求1所述的方法,其特征在于,还包括:建立异常接入检测模型的步骤:从已存储终端接入数据中,根据协议规范解析每条接入数据的关键字段;根据协议规定及正常和异常报文的不同特点,提取每条接入数据的多维特征库;采用以上训练集,将特征向量作为输入,异常行为作为输出,采用机器学习分类算法,建立与多维特征库对应的的异常接入检测模型。3.如权利要求1所述的方法,其特征在于,还包括:建立多维特征库的步骤:根据搜集的异常终端接入数据和搜集的正常终端接入数据,分别解析每条接入数据的特征向量;对比异常和正常终端接入数据中的各个字段的长度特征、各个字段的数量特征和不同异常行为的类型特征,获得异常终端接入数据的异常特征参数,并形成多维特征库。4.如权利要求1所述的方法,其特征在于,在搜集训练集时,将特征向量完全相同的多条接入数据合并为一条接入数据。5.如权利要求1所述的方法,其特征在于,在建立异常接入检测模型的步骤之后,还包括:获得待测试终端接入数据的特征向量,并利用该异常接入检测模型检测每条待测试终端接入数据,生成待测试终端接入数据对应地的检测结果;将所生成的检测结果与待测试终端接入数据的异常行为对比,获得该异常接入检测模型检测该待测试终端接入数据异常行为的正确率;判断正确率是否大于预设阈值;若是,则判定该异常接入检测模型有效;若否,则统计该异常接入检测模型针对多维特征库中每个特征参数的贡献度,并根据所统计的贡献度,重新执行建立异常接入检测模型的步骤。6.一种基于机器学习的终端接入数据异常检测装置,其特征在于,包括:第一特征参数获得单元、检测结果获得单元、检测结果分析单元和第一检测结果生成单元;其中,第一特征参数获得单元,用于获得当前接入数据的特征参数;检测结果获得单元,用于以所获得的特征参数为预设的检测模型的输入信息,获得当前接入数据的检测结果,其中,检测结果用于表示当前接入数据包含异常行为的特征值;检测模型为针对特征参数的检测模型,检测模型在满足预设的更新条件的情况下,根据所获得的特征参数进行更新;检测结果分析单元,用于分析检测结果,判断当前接入数据是否包含异常行为,触发第一检测结果生成单元;第一检测结果生成单元...

【专利技术属性】
技术研发人员:梁晓兵许斌翟峰刘鹰吕英杰岑炜付义伦李保丰曹永峰张庚孔令达徐萌冯云王楠袁泉冯占成杨全萍任博周琪卢艳韩文博李丽丽
申请(专利权)人:国家电网有限公司中国电力科学研究院有限公司国网福建省电力有限公司福州供电公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1