一种未知异构工业协议检测识别方法、系统、设备及介质技术方案

技术编号:33853066 阅读:49 留言:0更新日期:2022-06-18 10:40
本发明专利技术属于工业互联网技术领域,公开了一种未知异构工业协议检测识别方法、系统、设备及介质,所述未知异构工业协议检测识别方法包括接收到已知工业协议和未知工业协议的混合报文输入后,由预处理模块去除无效报文、按报文编码格式分流至对应编码的特征降维模块;特征降维模块对报文集进行特征提取和特征降维;已知工业协议报文筛选模块根据数据库中已有的已知协议报文训练算法和筛选分离已知协议报文和未知协议报文,将未知协议报文提交至未知工业协议报文识别模块;未知工业协议报文识别模块对筛选出的报文进行识别。本发明专利技术简化了工业互联网接入协议适配流程,提高了大规模工业设备接入的效率。业设备接入的效率。业设备接入的效率。

【技术实现步骤摘要】
一种未知异构工业协议检测识别方法、系统、设备及介质


[0001]本专利技术属于工业互联网
,尤其涉及一种未知异构工业协议检测识别方法、系统、设备及介质。

技术介绍

[0002]工业互联网在工业领域的推进过程中,多源设备和异构协议接入问题是阻碍进一步推进工业互联网产业化和市场化不利因素。国内工业行业产业规模大、建设时间跨度广,国内工厂流水线中各品牌工业PLC混杂、工业设备规格不统一,工业协议格式五花八门,无法采用国外基于分散控制系统和配套上位机的OPC接入解决方案,极大增加工业设备上云难度。
[0003]未知协议检测和识别,一直是网络安全领域、物联网设备接入领域的重要难点,国内外有较多研究。未知协议的特点是协议格式未知、协议长度未知、协议特征未知、协议流量未知,因此国内外研究者们大多通过格式、长度、流量、特征等方向去完成未知协议的检测识别算法,以达到检测未知协议的目的。论文采用的研究方法主要分为监督学习算法分类和无监督学习算法分类,监督学习算法有深度神经网络、卷积神经网络等算法;无监督学习算法主要有K

means聚类算法、DBSCAN聚类算法等。但由于工业现场环境的复杂性和工业协议的多源异构性,这些方法和算法并不能解决工业互联网接入过程中的问题和难点。
[0004]通过上述分析,现有技术存在的问题及缺陷为:工业现场接入环境复杂、工业协议多源异构、未知协议检测技术不适应工业互联网接入需求,极大增加了工业设备上云难度。

技术实现思路

[0005]针对现有技术存在的问题,本专利技术提供了一种未知异构工业协议检测识别方法、系统、设备及介质。
[0006]本专利技术是这样实现的,一种未知异构工业协议检测识别方法,所述未知异构工业协议检测识别方法包括:
[0007]接收到已知工业协议和未知工业协议的混合报文输入后,由预处理模块去除无效报文、按报文编码格式分流至对应编码的特征降维模块;特征降维模块对报文集进行特征提取和特征降维;已知工业协议报文筛选模块根据数据库中已有的已知协议报文训练算法和筛选分离已知协议报文和未知协议报文,将未知协议报文提交至未知工业协议报文识别模块;未知工业协议报文识别模块对筛选出的报文进行识别,去除干扰报文,将识别出的未知工业协议报文分类归档,实现从未知协议到已知协议的转换。
[0008]进一步,所述未知异构工业协议检测识别方法具体过程为:
[0009]步骤一,物理层工业数据采集终端上传的协议报文到达所在中间件后,通过预处理模块去除无效报文,按照报文编码类型分发至对应编码特征降维模块。本步骤剔除无效数据、按编码特点对输入报文进行分类,提高后续步骤的识别精确度。
[0010]步骤二,通过特征降维模块对报文进行特征提取和特征降维。本步骤提取出报文
的有效特征,压缩报文数据量,提升后续步骤识别性能。
[0011]步骤三,已知工业协议报文筛选模块根据协议训练数据库中的已知协议报文集将混合报文数据集划分为已知工业协议报文数据集和未知工业协议报文数据集,并把未知工业协议报文数据集递交至未知工业协议报文识别模块。本步骤通过提出DBSCAN改进算法简化DBSCAN算法识别流程,提升识别速度和准确率。
[0012]步骤四,未知工业协议报文识别模块对未知工业协议报文数据集进行识别,剔除干扰报文,将识别出的未知工业协议报文数据集分类存储至协议训练数据库。本步骤识别出未知工业协议族,通过存储至协议训练数据库完成未知协议到已知协议的转换。
[0013]进一步,所述步骤一中,通过预处理模块去除无效报文,按照报文编码类型分发至对应编码特征降维模块具体过程为:
[0014]首先判断报文栈长度,根据工业现场总线协议的共性将报文栈深度小于10的协议视为无效协议加以剔除;然后根据报文各数据位在数据链路层的编码范围将报文数据集划分为二进制编码报文数据集和ASCII编码报文数集。
[0015]进一步,所述步骤二中,通过特征降维模块对报文进行特征提取和特征降维具体过程为:
[0016]通过PCA主成分分析法对预处理模块提交的二进制编码报文数据集和ASCII编码报文数集进行特征提取和特征降维,提取出维度区分度最大的特征报文数据集。
[0017]进一步,所述步骤三中,已知工业协议报文筛选模块根据协议训练数据库中的已知协议报文集将混合报文数据集划分为已知工业协议报文数据集和未知工业协议报文数据集具体过程为:
[0018]根据二进制编码和ASCII编码的工业协议特征筛选已知工业协议报文,算法训练数据集存放于协议训练数据库中;
[0019]基于DBSCAN算法改进一种已知工业协议筛选算法,利用协议训练数据库中的特征报文训练算法,对输入报文降维数据集进行筛选识别。
[0020]进一步,所述步骤四中,未知工业协议报文识别模块对未知工业协议报文数据集进行识别,剔除干扰报文,将识别出的未知工业协议报文数据集分类存储至协议训练数据库具体过程为:通过DBSCAN算法进行识别。
[0021]本专利技术的另一目的在于提供一种实施所述未知异构工业协议检测识别方法的未知异构工业协议检测识别系统,所述未知异构工业协议检测识别系统包括:
[0022]预处理模块,用以接收工业数据采集终端上传的原始报文数据集,根据报文编码格式和报文类型,剔除无效报文,按报文编码对报文数据集进行划分;
[0023]特征降维模块,用以提供报文数据集特征降维功能,对预处理模块发送过来的报文数据集进行特征提取和特征降维,为已知工业协议筛选和未知工业协议识别提供支撑;
[0024]已知工业协议报文筛选模块,用以接收经特征降维模块处理的报文数据集,利用DBSCAN算法改进算法筛选未知协议报文,根据协议训练数据库中报文样本特征点性质对其进行筛选;
[0025]未知工业协议报文识别模块,通过利用DBSCAN算法将未知工业协议特征点聚类识别为工业协议族,根据识别出的工业协议族,将不同协议族的报文存入协议训练数据库中,将未知工业协议转化为已知工业协议。
[0026]本专利技术的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
[0027]步骤一,物理层工业数据采集终端上传的协议报文到达所在中间件后,通过预处理模块去除无效报文,按照报文编码类型分发至对应编码特征降维模块;
[0028]步骤二,通过特征降维模块对报文进行特征提取和特征降维;
[0029]步骤三,已知工业协议报文筛选模块根据协议训练数据库中的已知协议报文集将混合报文数据集划分为已知工业协议报文数据集和未知工业协议报文数据集,并把未知工业协议报文数据集递交至未知工业协议报文识别模块;
[0030]步骤四,未知工业协议报文识别模块对未知工业协议报文数据集进行识别,剔除干扰报文,将识别出的未知工业协议报文数据集分类存储至协议训练数据库。
[003本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种未知异构工业协议检测识别方法,其特征在于,所述未知异构工业协议检测识别方法包括:接收到已知工业协议和未知工业协议的混合报文输入后,由预处理模块去除无效报文、按报文编码格式分流至对应编码的特征降维模块;特征降维模块对报文集进行特征提取和特征降维;已知工业协议报文筛选模块根据数据库中已有的已知协议报文训练算法和筛选分离已知协议报文和未知协议报文,将未知协议报文提交至未知工业协议报文识别模块;未知工业协议报文识别模块对筛选出的报文进行识别,去除干扰报文,将识别出的未知工业协议报文分类归档,实现从未知协议到已知协议的转换。2.如权利要求1所述未知异构工业协议检测识别方法,其特征在于,所述未知异构工业协议检测识别方法具体过程为:步骤一,物理层工业数据采集终端上传的协议报文到达所在中间件后,通过预处理模块去除无效报文,按照报文编码类型分发至对应编码特征降维模块;步骤二,通过特征降维模块对报文进行特征提取和特征降维;步骤三,已知工业协议报文筛选模块根据协议训练数据库中的已知协议报文集将混合报文数据集划分为已知工业协议报文数据集和未知工业协议报文数据集,并把未知工业协议报文数据集递交至未知工业协议报文识别模块;步骤四,未知工业协议报文识别模块对未知工业协议报文数据集进行识别,剔除干扰报文,将识别出的未知工业协议报文数据集分类存储至协议训练数据库。3.如权利要求2所述未知异构工业协议检测识别方法,其特征在于,所述步骤一中,通过预处理模块去除无效报文,按照报文编码类型分发至对应编码特征降维模块具体过程为:首先判断报文栈长度,根据工业现场总线协议的共性将报文栈深度小于10的协议视为无效协议加以剔除;然后根据报文各数据位在数据链路层的编码范围将报文数据集划分为二进制编码报文数据集和ASCII编码报文数集。4.如权利要求2所述未知异构工业协议检测识别方法,其特征在于,所述步骤二中,通过特征降维模块对报文进行特征提取和特征降维具体过程为:通过PCA主成分分析法对预处理模块提交的二进制编码报文数据集和ASCII编码报文数集进行特征提取和特征降维,提取出维度区分度最大的特征报文数据集。5.如权利要求2所述未知异构工业协议检测识别方法,其特征在于,所述步骤三中,已知工业协议报文筛选模块根据协议训练数据库中的已知协议报文集将混合报文数据集划分为已知工业协议报文数据集和未知工业协议报文数据集具体过程为:根据二进制编码和ASCII编码的工业协议特征筛选已知工业协议报文,算法训练数据集存放于协议训练数据库中;基于DBSCAN算法改进一种已知工业协议筛选算法,利用协议训练数据库中的特征报文训练算法,对输入报文降维数据集进行筛选识别。6.如权利要求2所述未知异构工业协议检测识别方法,其特征在于,所述步骤四中,未知工业协议报文识别模块对未知工业协议报文数据集进...

【专利技术属性】
技术研发人员:沈玉龙蒋梓恒祝幸辉赵双睿何吉程珂
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1