当前位置: 首页 > 专利查询>清华大学专利>正文

基于包长概率分布与k近邻算法的物联网设备识别方法技术

技术编号:28038254 阅读:34 留言:0更新日期:2021-04-09 23:20
本发明专利技术属于计算机网络管理技术领域,尤其涉及一种基于包长概率分布与k近邻算法的物联网设备识别方法。本方法在充分挖掘不同物联网设备流量特征的基础上,以一定时间内通信设备产生的网络数据包的长度概率分布作为单一特征,并进一步设计了一种基于k近邻算法的分类器,利用k近邻算法对产生流量的源设备的类型,尤其是特定的物联网设备类型,进行分类和识别的系统。本方法能有效区分产生流量的源设备是否是物联网设备以及是哪种已知的具体设备类型。与已有的用于同类任务的方法相比,本发明专利技术不仅实现了更高的识别准确率,同时在运行效率、鲁棒性、可扩展性与对特殊场景的适应能力等性能指标上都取得了提升。

【技术实现步骤摘要】
基于包长概率分布与k近邻算法的物联网设备识别方法
本专利技术属于计算机网络管理
,尤其涉及一种基于包长概率分布与k近邻算法的物联网设备识别方法。
技术介绍
随着物联网技术的快速发展,各种各样不同类型的物联网设备已经被大量部署于人类生产生活的各个领域,如智能家居、智慧城市与工业控制系统等。在带来巨大便捷的同时,物联网设备的使用也为网络管理带来了新的挑战。不同于通用联网设备如智能手机和笔记本电脑,物联网设备通常仅具有受限的计算与通信能力,因此他们需要定制化的网络管理策略,如资源分配和预留、服务质量管理、访问控制和异常检测等。用一个具体的场景作为案例,当某种物联网设备被纰漏存在安全漏洞时,为了防止这些设备被攻击者入侵并进一步利用,网络管理员需要立即发现当前网络中是否存在同类型的危险设备。实现这类网络管理需求都依赖于能够从流量中快速准确识别出产生流量的源设备的类型的技术。识别物联网设备最直接的方法是观察设备流量中存在的具有辨识性的信息,如MAC地址中的OUI(OrganizationallyUniqueIdentifier)字段,DNS请本文档来自技高网...

【技术保护点】
1.一种基于包长概率分布与k近邻算法的物联网设备识别方法,其特征在于该方法包括以下步骤:/n(1)实时采集一个待识别物联网设备的流量,得到一个网络数据包集合,网络数据包集合中的元素为与网络数据包的长度和方向相对应的二元组;/n(2)对步骤(1)的网络数据包集合进行特征提取,包括以下步骤:/n(2-1)按照设定的时间间隔,将网络数据包集合划分为多组;/n(2-2)根据网络数据包集合中的长度和方向,将相同长度和方向的数据包合并为同一类别,统计每组网络数据包集合中的相同类别的数据包数量;/n(2-3)分别计算每组网络数据包集合中的不同类别的数据包数量各占数据包数量总和的比例,将该比例记为网络数据包二...

【技术特征摘要】
1.一种基于包长概率分布与k近邻算法的物联网设备识别方法,其特征在于该方法包括以下步骤:
(1)实时采集一个待识别物联网设备的流量,得到一个网络数据包集合,网络数据包集合中的元素为与网络数据包的长度和方向相对应的二元组;
(2)对步骤(1)的网络数据包集合进行特征提取,包括以下步骤:
(2-1)按照设定的时间间隔,将网络数据包集合划分为多组;
(2-2)根据网络数据包集合中的长度和方向,将相同长度和方向的数据包合并为同一类别,统计每组网络数据包集合中的相同类别的数据包数量;
(2-3)分别计算每组网络数据包集合中的不同类别的数据包数量各占数据包数量总和的比例,将该比例记为网络数据包二元组的概率,从而得到不同类别数据包的概率分布,即该网络数据包集合的特征;
(3)遍历所有待识别物联网设备,返回步骤(1),得到与所有待识别物联网设备相对应的网络数据包集合的特征,形成一个网络数据包集合特征集;
(4)将步骤(3)的网络数据包集合特征集输入到k近邻分类器中,k近邻分类器的距离度量方式为全变差距离或海林格距离:
全变差距离:



海林格距离:



k近邻分类器输出待识别物联网设备类型的分类结果,实现基于包长概率分布与k近邻算法的物联网设备识别。


2.如权利要求1所述的物联网设备识别方法,其特征在于所述的步骤(3)与步骤(4)之间还包括以下步骤:
(1)将所述的网络数据包集合特征集输入DBSCAN聚类算法,DBSCAN聚类算法的距离度量方式与权利要求1步骤(4)中的k近邻分类器的距离度量方式相同,DBCSAN聚类算法输出特征集聚类后的网络数据包集合特征簇与特征离群点;
(2)计算上述步骤(1)中得到的每个簇的几何中心点;
(3)将上述步骤(1)中的特征离群点与步骤(2)中的几何中心点作为新的特征集输入到权利要求1的步骤(4)的k近邻分类器中。


3.一种基于包长概率分布与k近邻算法的物联网设备识别方法,其特征在于包括以下步骤:
(1)实时采集一个待识别物联...

【专利技术属性】
技术研发人员:杨家海段晨鑫王之梁
申请(专利权)人:清华大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1