一种基于特征库的设备自动识别和扩容方法技术

技术编号:34819429 阅读:13 留言:0更新日期:2022-09-03 20:30
本发明专利技术公开了一种基于特征库的设备自动识别和扩容方法。在未知设备接入后,本发明专利技术能够与设备库中已有设备特征进行相似度对比,采用设备识别规则和识别算法模型相结合,对于已知设备进行识别。而对未知设备,在特征向量空间模型下,本发明专利技术按相似性准则对未知设备类型进行分类管理,锁定或缩小待识别设备的范围,自动生成设备特征信息并存入指定区域,待人工进行干预确认后,自动更新到设备库中。相比全人工提取设备特征,异构边缘设备接入的工作量减轻至少原来的一半。因此,本发明专利技术能够克服现阶段设备特征库无法自动扩容的问题,更好地提升边缘设备接入和配置的管理效率。升边缘设备接入和配置的管理效率。升边缘设备接入和配置的管理效率。

【技术实现步骤摘要】
一种基于特征库的设备自动识别和扩容方法


[0001]本专利技术涉及一种基于特征库的设备自动识别和扩容方法,属于工控自动化领域。

技术介绍

[0002]随着物联网技术的迅速发展,越来越多的边缘设备向着网络化、智能化的方向发展,边缘端联网设备接入的工作量迅速增多。现有边缘设备识别方法主要是基于特征库中设备特征信息进行识别,且只能对设备特征库中已知设备进行识别,未在设备库内的设备无法进行识别。
[0003]近年来,越来越多未知的、私有的网络通信协议设备接连不断的出现,边缘设备的多样化和异构发展趋势不仅使协议识别分析的难度增加,而且协议特征提取的工作量急速增长,给制造企业自动化升级改造带来了前所未有的挑战。同时,随着接入设备类型的增加,需要不断对设备特征库进行升级。然而,目前设备特征库缺乏自动更新机制,对如此大量的设备特征提取工作是极其繁重和枯燥的,需要大量的人工完成。
[0004]边缘异构设备的识别是建立物联网连接的重要前提,由于不同类别的边缘设备的协议、性能等千差万别,各不相同,因此针对边缘设备的识别应当采取分类的策略,而进行分类管理的第一步就是对设备类型的准确识别,在网络空间中快速、准确地识别出设备,细粒度地判断其设备属性,既有助于设备库不断扩容,支持更多设备接入,又能减轻技术人员提取设备特征的工作量,提高工作效率。
[0005]申请号为202110974559.4的专利技术专利申请提出了一种配电网物联终端设备实时探测识别方法与系统。该专利申请更多关注电力配电网领域,依据现有的配电网物联终端设备基础信息库,通过对比量化方法,实现对在线终端设备的识别,增加配电网运行的可信度和透明度。但设备基础信息库缺乏自动更新机制。
[0006]申请号为202010187111.3的专利技术专利申请提出了一种终端设备识别系统及其方法。该专利申请对于设备特征库中的未知设备,创建监控模块与设备之间的对应关系,实现终端设备快速识别和配置,提高终端设备批量组网及集成管理的效率,未涉及设备库更新机制。
[0007]申请号为202011643313.0的专利技术专利申请提出了一种特征库更新方法、装置、网络设备及可读存储介质。该专利申请更多关注网络安全
,通过在网络设备的共享内存的指定数据结构中,加载并编译用于替换第一特征库的第二特征库,并设置同步锁,改善在对特征库更新期间的网络安全问题。但其特征库更新方法不适用于工控领域边缘设备自动识别和特征库扩容的需求。

技术实现思路

[0008]本专利技术要解决的技术问题是:现有边缘设备识别方法中,设备特征库缺乏自动更新机制,但随着接入设备类型的增加,需要不断对设备特征库进行升级。
[0009]为了解决上述技术问题,本专利技术的技术方案是提供了一种基于特征库的设备自动
识别和扩容方法,其特征在于,包括以下步骤:
[0010]步骤1、将物联网设备的特征报文抽象成为一个由特征词构成的词频向量,经过特征工程处理后,将物联网设备信息转化为多维特征向量的形式,基于已接入设备业务的积累,在云端建立设备特征库;
[0011]步骤2、当新的物联网设备上线后,通过样本采集模块获取物联网设备的HTTP响应包作为原始样本;
[0012]步骤3、由特征提取模块提取原始样本的样本特征:
[0013]特征提取模块提取HTTP响应包中能够反映物联网设备的信息,随后利用特征工程得到与之对应的向量化的词向量信息作为样本特征;
[0014]步骤4、由数据预处理模块对特征提取模块提取的样本特征进行预处理,将文本类型的样本特征转化为数值类型的样本特征,从而将物联网设备信息转化为多维特征向量;
[0015]步骤5、算法识别模块以当前上线物联网设备的多维特征向量作为输入,将该多维特征向量与设备特征库中已知类型的标记物联网设备的多维特征向量进行特征匹配,若当前上线物联网设备的多维特征向量与设备特征库中已知类型的任意标记物联网设备的多维特征向量一致,则当前上线物联网设备属于已知设备,实现对当前上线物联网设备的识别,否则,当前上线物联网设备属于未知设备,算法识别模块使用改进约束种子K

means识别算法进行向量相似度计算,对当前上线物联网设备进行识别分类,该改进约束种子K

means识别算法使用两个多维特征向量的余弦相似度来度量相似度,并基于余弦相似度利用K

means识别算法进行聚类;聚类时,当未知设备所对应的多维特征向量与某一已知设备类型的簇的聚类中心的余弦相似度值大于给定阈值ε时,则将未知设备归入该簇,当前未知设备的设备类型为簇所对应的设备类型,并基于当前未知设备的多维特征向量生成对应的设备和通信特征存入指定区域;当未知设备所对应的多维特征向量与所有簇的聚类中心的余弦相似度值都不大于给定阈值ε时,说明当前未知设备属于新的设备类别,基于当前未知设备的多维特征向量自动新建新的设备类型后,将当前未知设备归入新的设备类型,再基于当前未知设备的多维特征向量生成对应的设备和通信特征存入指定区域;
[0016]步骤6、人工读取存入指定区域的设备和通信特征,并获取新的设备类型,对未知设备的生产厂家、设备类别、型号、通信特征等信息进行人工校对,并人工确认对于未知设备的分类以及新的设备类型是否正确;待人工进行干预确认后,实现对未知设备的识别,再将新的设备类型、已识别的未知设备的设备和通信特征自动更新到设备特征库中,从而实现设备特征库的半自动扩容。
[0017]优选地,所述步骤2包括以下步骤:
[0018]步骤201、样本采集模块在整个IP地址空间中进行端口扫描,获取无标记的未知物联网设备的IP地址,加入设备特征库中已知类型的标记物联网设备的IP地址后形成设备IP地址集;
[0019]步骤202、样本采集模块向设备IP地址集中所有IP地址发送请求,获取完整的HTTP响应包头部作为对应上线物联网设备的原始样本。
[0020]优选地,所述步骤3包括以下步骤:
[0021]步骤301、特征提取模块统计HTTP响应包中的头字段总数,并去除冗余信息;
[0022]步骤302、特征提取模块从所有头字段中选取出现频率最高的字段作为设备特征
信息,随后经过特征工程处理得到与之对应的向量化的词向量信息,该向量化的词向量信息即为原始样本的样本特征。
[0023]优选地,所述步骤5中,向量X和向量Y的余弦相似度cosθ采用下式计算:
[0024][0025]式中,x
i
、y
i
分别为向量X和向量Y中的第i个元素。
[0026]在未知设备接入后,本专利技术能够与设备库中已有设备特征进行相似度对比,采用设备识别规则和识别算法模型相结合,对于已知设备进行识别。而对未知设备,在特征向量空间模型下,本专利技术按相似性准则对未知设备类型进行分类管理,锁定或缩小待识别设备的范围,自动生成设备特征信息并存入指定区域,待人工进行干预确认后,自动更新到设备库中。相比全人工提取本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于特征库的设备自动识别和扩容方法,其特征在于,包括以下步骤:步骤1、将物联网设备的特征报文抽象成为一个由特征词构成的词频向量,经过特征工程处理后,将物联网设备信息转化为多维特征向量的形式,基于已接入设备业务的积累,在云端建立设备特征库;步骤2、当新的物联网设备上线后,通过样本采集模块获取物联网设备的HTTP响应包作为原始样本;步骤3、由特征提取模块提取原始样本的样本特征:特征提取模块提取HTTP响应包中能够反映物联网设备的信息,随后利用特征工程得到与之对应的向量化的词向量信息作为样本特征;步骤4、由数据预处理模块对特征提取模块提取的样本特征进行预处理,将文本类型的样本特征转化为数值类型的样本特征,从而将物联网设备信息转化为多维特征向量;步骤5、算法识别模块以当前上线物联网设备的多维特征向量作为输入,将该多维特征向量与设备特征库中已知类型的标记物联网设备的多维特征向量进行特征匹配,若当前上线物联网设备的多维特征向量与设备特征库中已知类型的任意标记物联网设备的多维特征向量一致,则当前上线物联网设备属于已知设备,实现对当前上线物联网设备的识别,否则,当前上线物联网设备属于未知设备,算法识别模块使用改进约束种子K

means识别算法进行向量相似度计算,对当前上线物联网设备进行识别分类,该改进约束种子K

means识别算法使用两个多维特征向量的余弦相似度来度量相似度,并基于余弦相似度利用K

means识别算法进行聚类;聚类时,当未知设备所对应的多维特征向量与某一已知设备类型的簇的聚类中心的余弦相似度值大于给定阈值ε时,则将未知设备归入该簇,当前未知设备的设备类型为簇所对应的设备类型,并基于当前未知设备的多维特征向量生成对应的设备和通信特征存入指定区域;当未知设备所对应的多维特征向量...

【专利技术属性】
技术研发人员:赵金凤吴小东奚培锋郭曦泽程睿远
申请(专利权)人:上海电器科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1