【技术实现步骤摘要】
工控协议数据异常检测模型的训练方法和训练装置
[0001]本公开总体说来涉及数据异常检测
,更具体地讲,涉及工控协议数据异常检测模型的训练方法和训练装置。
技术介绍
[0002]工控协议具有半开放、半透明的特点,但是许多工控协议在设计之初并未充分考虑通信安全问题,致使多种多样的异常报文导致主设备或从设备异常,存在诸多安全隐患。
[0003]异常检测(或离群值检测)是从事件或观察结果中识别出罕见现象,这些事件由于与大多数数据有着显著差异而被怀疑为异常。目前,无论是在信用卡欺诈还是在垃圾邮件诈骗等电信诈骗、网络攻击等方面都存在着安全风险,而在工控协议数据流中,面临着更为特殊的安全威胁,因为在工控系统不间断的运行中,更新系统和补丁等防护措施很难实时做到。考虑到异常检测可以从数据中剔除异常数据,降低数据的噪音对正常数据的影响,因此,对于工控协议数据进行异常检测在数据安全方面具有现实的特殊意义。
[0004]现有的异常检测技术有通过数据解析的方式对通信协议、行为数据、网络数据和系统状态等进行异常检测,也有基于机器 ...
【技术保护点】
【技术特征摘要】
1.一种工控协议数据异常检测模型的训练方法,其特征在于,所述工控协议数据异常检测模型包括组合编码模块、预训练模型和自编码网络,其中,所述训练方法包括:获取工控协议数据流,其中,所述工控协议数据流是以十六进制表示的数据;基于所述组合编码模块,将所述工控协议数据流中的每两个相邻的十六进制数绑定为组合码,并将组合码转换为索引值,从而得到索引序列;基于所述预训练模型,将所述索引序列转换为第一特征向量序列;基于所述自编码网络,将所述第一特征向量序列转换为第二特征向量序列并进行损失计算,从而对所述工控协议数据异常检测模型进行训练。2.如权利要求1所述的训练方法,其特征在于,所述工控协议数据流包括第一数量个十六进制数,所述索引序列包括第二数量个索引值,其中,所述第一数量为所述第二数量的2倍。3.如权利要求2所述的训练方法,其特征在于,所述基于所述组合编码模块,将所述工控协议数据流中的每两个相邻的十六进制数绑定为组合码,并将组合码转换为索引值,从而得到索引序列的步骤包括:通过将所述工控协议数据流中的每两个相邻的十六进制数绑定为组合码,得到样本序列,其中,所述样本序列包括第二数量个组合码;基于预设的索引词典库,将所述样本序列中的组合码转换为索引值,从而将所述样本序列转换为索引序列,其中,所述索引词典库中的每个索引值各自对应一个组合码。4.如权利要求3所述的训练方法,其特征在于,所述索引词典库包括256种索引值与组合码的对应关系。5.如权利要求3所述的训练方法,其特征在于,所述基于所述预训练模型,将所述索引序列转换为第一特征向量序列的步骤包括:基于所述预训练模型,将所述索引序列中的索引值转换为特征向量,从而将所述索引序列转换为第一特征向量序列,其中,每个索引值各自转换为预设维度的特征向量,所述第一特征向量序列包括第二数量个特征向量。6.如权利要求5所述的训练方法,其特征在于,所述基于所述自编码网络,将所述第一特征向量序列转换为第二特征向量序列并进行损失计算,从而对所述工控协议数据异常检测模型进行训练的步骤包括:基于所述自编码网络,将所述第一特征向量序列中的每个特征向量进行降维压缩和解码还原,从而得到第二特征向量序列,其中,所述第二特征向量序列包括第二数量个预设维度的特征向量;基于所述第一特征向量序列和所述第二特征向量序列,对所述工控协议数据异常检测模型进行损失计算。7.如权利要求6所述的训练方法,其特征在于,所述自编码网络包括编码器和解码器,...
【专利技术属性】
技术研发人员:丁醒醒,孙鹏程,刘萱,李瑞群,王潇茵,杜婉茹,
申请(专利权)人:航天宏康智能科技北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。