水文物联网前端设备识别方法及系统技术方案

技术编号:34948648 阅读:23 留言:0更新日期:2022-09-17 12:24
本发明专利技术公开了一种水文物联网前端设备识别方法,它包括如下步骤:第一步,通过网络流量采集装置对水文物联网前端设备网络流量进行实时采集;第二步,对实时获取原始网络流量进行数据提取;第三步,根据TCP协议和UDP协议特征,对提取的数据报文信息进行过滤;第四步,将统计好的信息转换为n*m的矩阵;第五步,将转换好的矩阵输入到多分类物联网前端设备识别模型中进行识别;第六步,将实时采集流量信息和设备类型一一对应,上传到物联网设备管理平台进行存储。本发明专利技术通过设计多分类DNN神经网络模型,实现对水文物联网前端设备识别,其识别准确率达到98%以上,且安全程度高。且安全程度高。且安全程度高。

【技术实现步骤摘要】
水文物联网前端设备识别方法及系统


[0001]本专利技术涉及物联网信息
,具体的是一种水文物联网前端设备识别方法及系统。

技术介绍

[0002]水文监测系统是国家关键信息基础设施之一,适用于远程监测自然河流、人工运河、景观河道等的实时水文状况,承担了防洪、灌溉、排泄、蓄洪、航运、水利发电等关系到国计民生的职责,一旦遭受网络攻击将会造成重大影响。在水文监测系统中,产生了大量信息技术应用,如物联网架构的遥测设备监控、视频监控以及办公人员的电子信息系统,接入网络的各种物联网前端设备的数量和采集的数据都与日俱增,这给水文监测系统带来前所未有的网络安全威胁。尤其是,水文物联网前端设备缺乏网络认证授权控制,导致出现非法设备访问、僵尸网络、拒绝服务攻击等安全问题。因此,需要对水文物联网前端设备进行识别和管控。
[0003]物联网设备识别的方案通常包括主动探测和被动分析,在物联网场景下,多数设备硬件配置和绝对性能较上位机、服务器要低,主动探测技术向设备发送探测包并要求设备作出响应,会消耗物联网设备的性能,可能造成设备运行异常甚至死机的情况,或者物联网设备通过蜂窝网络接入运营商基站,主动探测技术无法直接访问设备。因此主动探测技术的使用范围受到严格管控和限制。被动分析,包括硬件加密识别、流量特征识别等。硬件加密识别需要在物联网设备中植入加密芯片,受限于物联网设备软硬件资源,且需对每个物联网设备进行改造,成本较高;流量特征识别基于物联网设备与服务器交互流量的监听与分析,无需对现有物联网框架网络进行改造,适应性较好,但存在识别准确度较低的问题。传统的流量特征识别主要以MAC地址、IP地址、主机名等信息为准,但是这些信息均可被伪造。
[0004]机器学习算法能够处理高维和多变量数据,并在复杂和动态环境中提取数据中的隐藏关系,在物联网设备识别中具有很好的应用前景,特别是针对水文物联网前端设备识别缺少现有技术方案。在实际的物联网设备网络流量识别中有三个关键点需要考虑:一是数据特征;二是算法模型;三是识别精度。首先,水文物联网前端设备流量识别与传统物联网设备流量的区别以及如何从这些区别中提取出有效信息是构建水文物联网前端设备指纹的一个基础,其次,选择合适的机器学习算法模型是关键,最后,模型准确度是能否实现水文物联网设备识别与管理的保证。

技术实现思路

[0005]针对上述现有技术的不足,本专利技术提供了一种安全、准确度高的水文物联网前端设备识别方法及系统。
[0006]本专利技术解决其技术问题所采用的技术方案是:
[0007]一种水文物联网前端设备识别方法,它包括如下步骤,
[0008]第一步,通过网络流量采集装置对水文物联网前端设备网络流量进行实时采集;
[0009]第二步,对实时获取原始网络流量进行数据提取,得到目的IP地址、目的端口、源IP地址、源端口、网络协议以及数据报文信息;
[0010]第三步,根据TCP协议和UDP协议特征,对提取的数据报文信息进行过滤,将数据报文信息分为前向报文和反向报文,分别统计两种报文的长度、连接持续时间、报文流速等数据特征;
[0011]第四步,将统计好的信息转换为n*m的矩阵,n行代表网络流量数据的数量,m列代表流量数据的数据特征;
[0012]第五步,将转换好的矩阵输入到多分类物联网前端设备识别模型中进行识别,识别结果作为设备分类的结果;
[0013]第六步,将实时采集流量信息和设备类型一一对应,上传到物联网设备管理平台进行存储。
[0014]进一步的,所述多分类物联网前端设备识别模型采用多分类DNN神经网络模型。
[0015]进一步的,所述多分类DNN神经网络模型训练步骤包括:
[0016]第一步,数据预处理:首先,获取水文物联网前端设备网络流量的历史数据pcap文件,将pcap文件中原始网络流量数据进行过滤,保留TCP协议和 UDP协议的数据;然后,基于时间序列进行分析,将数据报文流向分为正向数据报文流向和反向数据报文流向,并统计双向数据流信息,包括持续时间、报文数、字节数、报文长度等数据特征;最后,将统计信息转换为n*m的矩阵, n行代表网络流量数据的数量,m列代表流量数据的数据特征,最后一列为设备类型标签,保存为csv文件;
[0017]第二步,特征筛选:读取csv文件,删除数据中的脏数据;对水文物联网前端设备指纹库进行筛选,利用特征选择算法Xgboost进行特征的筛选;删去 Xgboost算法得出特征的重要性排名较低的特征;按照特征数量按照特征重要性评分的高低顺序逐步增加特征,直到模型性能不再提高为止;然后,去除五元组信息,选择最佳性能的数据特征为67种数据特征,形成数据集;
[0018]第三步,将数据集分为训练数据集和测试数据集;
[0019]第四步,将训练数据集输入多分类DNN神经网络模型进行训练;测试数据集输入多分类物联网前端设备识别模型进行测试,完成模型训练。
[0020]本专利技术提供的水文物联网前端设备识别系统,其特征在于,它包括,流量采集模块、设备识别模块、存储模块以及数据发送模块;
[0021]流量采集模块分为在线采集单元和离线读取单元,在线采集单元可以获取交换机网卡中网络流量,并将采集到的packet信息以数据流进行统计分析转换为水文物联网前端设备的指纹库;离线读取单元,读取pcap文件中全部的 packet信息,将全部的packet信息的数据流转换为水文物联网前端设备的指纹库;设备识别模块包括多分类水文物联网前端设备识别模型,将水文物联网前端设备的指纹库信息输入到模型中,得到识别结果,将识别结果与水文物联网前端设备指纹库信息一一对应,保存到装置中的存储模块中;存储模块将提取的数据保存为csv文件,作为日志文件保存在本地;数据发送模块,将获取的网络流量信息和识别结果上传到物联网设备管理平台。
[0022]本专利技术的有益效果是:本专利技术通过设计多分类DNN神经网络模型,实现对水文物联
网前端设备识别,其识别准确率达到98%以上,且安全程度高。
附图说明
[0023]附图1为本专利技术多分类水文物联网前端设备识别模型流程图;
[0024]附图2为多分类DNN神经网络模型图;
[0025]附图3为水文物联网前端设备指纹库信息;
[0026]附图4为水文物联网前端设备流量提取装置流程图;
具体实施方式
[0027]为了更好地理解本专利技术,下面结合附图1

4来详细解释本专利技术的实施方式。
[0028]水文物联网前端设备识别方法是在水文监控系统中,通过物联网设备识别装置实时采集前端设备产生的网络流量,将采集到的网络流量输入到基于深度学习的多分类物联网识别模型中,其识别结果与设备类型一一对应,设备类型包括物联网遥测设备、视频监控设备以及办公设备,将获取网络流量信息和识别结果上传到物联网设备管理平台,从而实现对水文物联网前端设备的识别和管控。基于深度学习的多分类物联网识别模型,利用xgboos本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种水文物联网前端设备识别方法,其特征在于它包括如下步骤,第一步,通过网络流量采集装置对水文物联网前端设备网络流量进行实时采集;第二步,对实时获取原始网络流量进行数据提取,得到目的IP地址、目的端口、源IP地址、源端口、网络协议以及数据报文信息;第三步,根据TCP协议和UDP协议特征,对提取的数据报文信息进行过滤,将数据报文信息分为前向报文和反向报文,分别统计两种报文的长度、连接持续时间、报文流速等数据特征;第四步,将统计好的信息转换为n*m的矩阵,n行代表网络流量数据的数量,m列代表流量数据的数据特征;第五步,将转换好的矩阵输入到多分类物联网前端设备识别模型中进行识别,识别结果作为设备分类的结果;第六步,将实时采集流量信息和设备类型一一对应,上传到物联网设备管理平台进行存储。2.如权利要求1所述的水文物联网前端设备识别方法,其特征在于,所述多分类物联网前端设备识别模型采用多分类DNN神经网络模型。3.如权利要求2所述的水文物联网前端设备识别方法,其特征在于,所述多分类DNN神经网络模型训练步骤包括:第一步,数据预处理:首先,获取水文物联网前端设备网络流量的历史数据pcap文件,将pcap文件中原始网络流量数据进行过滤,保留TCP协议和UDP协议的数据;然后,基于时间序列进行分析,将数据报文流向分为正向数据报文流向和反向数据报文流向,并统计双向数据流信息,包括持续时间、报文数、字节数、报文长度等数据特征;最后,将统计信息转换为n*m的矩阵,n行代表网络流量数据的数量,m列代表流量数据的数据特...

【专利技术属性】
技术研发人员:吴兆龙张文帅王永起
申请(专利权)人:同智伟业软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1