一种物联网设备识别方法及系统技术方案

技术编号:21634266 阅读:27 留言:0更新日期:2019-07-17 12:52
本发明专利技术实施例提供一种物联网设备识别方法及系统,向待识别设备的多个预设端口依次发送每个预设端口对应的探测数据包,根据待识别设备返回的响应数据包确定待识别设备所采用的传输协议;若传输协议属于半结构化数据协议,则提取响应数据包中的结构特征和样式特征,根据结构特征和样式特征获得待识别设备的三元组属性;若传输协议属于无结构化数据协议,则提取响应数据包中的内容特征,根据内容特征获得待识别设备的三元组属性。该方法及系统通过将传输协议划分为半结构化数据协议和无结构化数据协议,并针对这两种协议采用不同的方式进行物联网设备识别,能够对目前所有物联网设备进行有效识别,进而能够有效确保网络空间的安全性。

An Internet of Things Equipment Recognition Method and System

【技术实现步骤摘要】
一种物联网设备识别方法及系统
本专利技术实施例涉及通信
,更具体地,涉及一种物联网设备识别方法及系统。
技术介绍
大量的物联网设备(如IP摄像机,路由器,打印机,服务器等)直接暴露在互联网上,用户可以通过公网IP直接进行访问交互。然而,这些物联网设备由于缺乏有效地安全保护或设备本身存在软件漏洞,很容易被黑客恶意攻击。例如,2016年10月,美国东海岸断网事件归因于大量具有弱密钥的IP摄像机被黑客用于DDOS攻击。可以看出,物联网设备带给网络空间的安全问题不容忽视。统计数据表明,同一品牌或系列的设备通常具有相同的漏洞,例如CVE-2018-1149,CVE-2018-1150,影响了大多数NUUO摄像头和监控设备。因此,有效识别网络空间中的物联网设备对于把握网络空间的安全态势具有重要意义。现有的物联网设备识别技术主要是通过提取应用层响应数据包中的设备属性关键字来识别物联网设备。但是该识别技术存在很大的局限性,因为网络空间中仍然存在大量的物联网设备的应用层协议数据包中不存在设备属性关键字,或者关键字与其他信息混合在一起难以进行提取,导致存在大量的物联网设备难以被识别,无法有效确保网络空间的安全性。有鉴于此,亟需提供一种物联网设备识别方法及系统,以能够对所有物联网设备进行有效识别,进而有效确保网络空间的安全性。
技术实现思路
本专利技术实施例为了克服现有的物联网设备识别技术难以对所有物联网设备进行识别,导致无法有效确保网络安全性的问题,提供一种物联网设备识别方法及系统。第一方面,本专利技术实施例提供一种物联网设备识别方法,包括:向待识别设备的多个预设端口依次发送每个预设端口对应的探测数据包,根据所述待识别设备返回的响应数据包确定所述待识别设备所采用的传输协议;若所述传输协议属于半结构化数据协议,则提取所述响应数据包中的结构特征和样式特征,将所述结构特征和样式特征的组合作为第一目标特征,根据所述第一目标特征获得所述待识别设备的三元组属性;若所述传输协议属于无结构化数据协议,则提取所述响应数据包中的内容特征,作为第二目标特征,根据所述第二目标特征获得所述待识别设备的三元组属性;其中,所述三元组属性包括设备类型、设备品牌和产品系列。第二方面,本专利技术实施例提供一种物联网设备识别系统,包括:协议探测模块,用于向待识别设备的多个预设端口依次发送每个预设端口对应的探测数据包,根据所述待识别设备返回的响应数据包确定所述待识别设备所采用的传输协议;第一识别模块,用于若所述传输协议属于半结构化数据协议,则提取所述响应数据包中的结构特征和样式特征,将所述结构特征和样式特征的组合作为第一目标特征,根据所述第一目标特征获得所述待识别设备的三元组属性;第二识别模块,用于若所述传输协议属于无结构化数据协议,则提取所述响应数据包中的内容特征,作为第二目标特征,根据所述第二目标特征获得所述待识别设备的三元组属性;其中,所述三元组属性包括设备类型、设备品牌和产品系列。第三方面,本专利技术实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所提供的方法的步骤。第四方面,本专利技术实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。本专利技术实施例提供的物联网设备识别方法及系统,向待识别设备的多个预设端口依次发送每个预设端口对应的探测数据包,根据待识别设备返回的响应数据包确定待识别设备所采用的传输协议;若传输协议属于半结构化数据协议,则提取响应数据包中的结构特征和样式特征,根据结构特征和样式特征获得待识别设备的三元组属性;若传输协议属于无结构化数据协议,则提取响应数据包中的内容特征,根据内容特征获得待识别设备的三元组属性。该方法及系统通过将目前所有物联网设备涉及的所有传输协议划分为半结构化数据协议和无结构化数据协议,针对半结构化数据协议和无结构化数据协议通过提取响应数据包中的不同特征实现对待识别设备的有效识别,能够对目前所有物联网设备进行有效识别,进而能够有效确保网络空间的安全性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的物联网设备识别方法的流程示意图;图2为本专利技术实施例提供的物联网设备识别系统的结构示意图;图3为本专利技术实施例提供的电子设备的实体结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1为本专利技术实施例提供的物联网设备识别方法的流程示意图,如图1所示,本专利技术实施例提供一种物联网设备识别方法,包括:S1,向待识别设备的多个预设端口依次发送每个预设端口对应的探测数据包,根据待识别设备返回的响应数据包确定待识别设备所采用的传输协议;具体地,本专利技术实施例中,利用网络嗅探器向待识别设备的多个预设端口依次发送每个预设端口对应的探测数据包。其中,多个预设端口包括80端口、443端口和161端口等多个常用端口。可以理解的是,由于每个预设端口对应的传输协议是不同的,因此每个预设端口对应的探测数据包也并不相同。例如,由于80端口对应的传输协议为HTTP协议,因此80端口对应的探测数据包是根据HTTP协议构造的探测数据包;443端口对应的传输协议为HTTPS协议,因此443端口对应的探测数据包是根据HTTPS协议构造的探测数据包;161端口对应的传输协议为SNMP协议,因此161端口对应的探测数据包是根据SNMP协议构造的探测数据包。此外,本专利技术实施例中,根据各个预设端口的历史使用情况预先设置了各个预设端口各自对应的优先级,例如,大部分物联网设备均采用80端口进行数据传输,因此80端口的优先级最高。在上述技术方案的基础上,本专利技术实施例中,按照优先级从高到低的顺序依次向待识别设备的每个预设端口依次发送每个预设端口对应的探测数据包。在向待识别设备的某个预设端口发送该预设端口对应的探测数据包之后,若接收到待识别设备返回的响应数据包,则可确定该预设端口为待识别设备进行数据传输所采用的端口,该预设端口对应的传输协议即为待识别设备所采用的传输协议。例如,在向待识别设备的80端口发送该80端口对应的探测数据包之后,若接收到待识别设备返回的响应数据包,则可确定待识别设备进行数据传输所采用的端口为80端口,且待识别设备所采用的传输协议为HTTP协议。需要说明的是,由于某些预设端口对应的传输协议属于TCP协议,即面向连接的通信协议。例如,80端口对应的HTTP协议和443端口对应的HTTPS协议均属于TCP协议。针对这些预设端口,为了缩短这些预设端口的探测时间,本专利技术实施例中,在向这些预设端口发送其对应的探测数据包之前,先向这些预本文档来自技高网...

【技术保护点】
1.一种物联网设备识别方法,其特征在于,包括:向待识别设备的多个预设端口依次发送每个预设端口对应的探测数据包,根据所述待识别设备返回的响应数据包确定所述待识别设备所采用的传输协议;若所述传输协议属于半结构化数据协议,则提取所述响应数据包中的结构特征和样式特征,将所述结构特征和样式特征的组合作为第一目标特征,根据所述第一目标特征获得所述待识别设备的三元组属性;若所述传输协议属于无结构化数据协议,则提取所述响应数据包中的内容特征,作为第二目标特征,根据所述第二目标特征获得所述待识别设备的三元组属性;其中,所述三元组属性包括设备类型、设备品牌和产品系列。

【技术特征摘要】
1.一种物联网设备识别方法,其特征在于,包括:向待识别设备的多个预设端口依次发送每个预设端口对应的探测数据包,根据所述待识别设备返回的响应数据包确定所述待识别设备所采用的传输协议;若所述传输协议属于半结构化数据协议,则提取所述响应数据包中的结构特征和样式特征,将所述结构特征和样式特征的组合作为第一目标特征,根据所述第一目标特征获得所述待识别设备的三元组属性;若所述传输协议属于无结构化数据协议,则提取所述响应数据包中的内容特征,作为第二目标特征,根据所述第二目标特征获得所述待识别设备的三元组属性;其中,所述三元组属性包括设备类型、设备品牌和产品系列。2.根据权利要求1所述的方法,其特征在于,提取所述响应数据包中的结构特征,具体为:根据所述传输协议获取所述响应数据包中的有效数据,将所述有效数据的格式转化为第一预设格式,作为第一目标数据;获取所述第一目标数据中的所有Tag节点,将所有Tag节点的嵌套关系转换成DOM树;利用先序遍历算法将所述DOM树转化为一维向量,将所述一维向量作为所述响应数据包中的结构特征。3.根据权利要求1所述的方法,其特征在于,提取所述响应数据包中的样式特征,具体为:根据所述传输协议获取所述响应数据包中的有效数据,将所述有效数据的格式转化为第一预设格式,作为第一目标数据;获取所述第一目标数据中的所有Tag节点,提取所有Tag节点各自对应的节点属性,将所有Tag节点对应的节点属性去重后进行组合,作为目标向量;采用One-hot编码将所述目标向量映射到预设欧式空间,将映射后的目标向量作为所述响应数据包中的样式特征。4.根据权利要求1所述的方法,其特征在于,提取所述响应数据包中的内容特征,具体为:根据所述传输协议获取所述响应数据包中的有效数据,将所述有效数据的格式转化为第二预设格式,作为第二目标数据;利用预设滑动窗口在所述第二目标数据上进行滑动取词,获得所述第二目标数据对应的词向量,利用预设算法对所述词向量进行编码,获得所述词向量对应的特征编码,作为所述响应数据包中的内容特征。5.根据权利要求4所述的方法,其特征在于,利用预设算法对所述词向量进行编码,获得所述词向量对应的特征编码,具体为:对所述词向量中的每个词进行哈希计算,获得每个词对应的二进制编码序列,将每个词对应的二进制编码序列中的0转换为-1,获得每个词对应的转换编码序列;根据每个词对应的预设权重对每个词对应的转换编码序列进行赋值,获得每个词对应的赋值编码序列,将所述词向量中的所有词对应的赋值编码序列进行按位相加,获得所述词向量对应的中间编码序列;将所述中间编码序列中编码值大于0的编码转换为1,将所述中间编码序列中编码值小于0的编码转...

【专利技术属性】
技术研发人员:于楠王旭闫兆腾朱红松孙利民丰轩李红
申请(专利权)人:中国科学院信息工程研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1