当前位置: 首页 > 专利查询>湖南大学专利>正文

基于流量采样的设备类型识别方法、终端设备和存储介质技术

技术编号:38662002 阅读:13 留言:0更新日期:2023-09-02 22:44
本发明专利技术公开了一种基于流量采样的设备类型识别方法、终端设备和存储介质,不需要采集完整的设备流量,仅需在网关处进行流量的采样,即可进行设备识别。为了应对流量特征缺失的问题,传统的张量填充算法学习张量行、列、深度对应的嵌入本身,不能推广到未知的行、列或深度,存在需要反复重训练,缺失特征补全耗时长,开销大的问题。本发明专利技术提出了一种归纳式张量填充方法,该方法能够利用历史信息,学习生成嵌入的函数,进行快速、有效设备流量特征补全。全。全。

【技术实现步骤摘要】
基于流量采样的设备类型识别方法、终端设备和存储介质


[0001]本专利技术涉及深度学习和设备识别
,特别是一种基于流量采样的设备类型识别方法、终端设备和存储介质。

技术介绍

[0002]随着嵌入式系统,无线通信,云计算和人工智能的发展,物联网在工业,家庭和办公领域得到广泛应用。为了保证物联网的安全和服务管理,及时识别物联网设备对整个物联网环境的管理是非常重要的。例如,网络服务提供商可以为识别为智能音响的设备,分配更高的带宽来提高用户体验和满意度;可以为识别为烟雾报警器或智能门锁的设备,提供更可靠的通信服务以确保用户的生命安全。
[0003]基于流量特征的设备识别是一类有效的设备识别方法,其通过从物联网设备的完整流量中提取诸如时间间隔、通信流量和协议等特征,并应用机器学习多分类器如随机森林、支持向量机、卷积神经网络、长短期记忆网络等,对设备流量行为特征进行分类,从而实现设备的识别。该类方法可大致分为三步:(1)采集设备的完整流量;(2)从采集的完整设备流量中提取设备流量行为特征;(3)将流量特征输入到设备识别模型,即机器学习多分类器中,进行设备类型的识别与分类。
[0004]尽管这类基于流量特征的设备识别,识别准确性较高。然而,其仍然存在一些不可忽略的技术问题,即它们依赖于从完整的流量流中提取特征,如源/目的地址、源/目的端口、网络协议、上下行数据包长度的平均/标准偏差、持续时间、有效载荷等。而获得完整的数据流需要在网关上连续捕获数据包,这不仅会增加网关的计算负担和存储压力,还可能影响网络通信速度和稳定性,进而造成方法的鲁棒性和实用性较差。
[0005]另外,一种基于时间序列的环保设备识别方法也是一种有效的设备识别方法。这种方法,虽然不是基于设备流量的识别方法,但它仍然需要采集完整的环保设备实时波形数据。即使它们使用了图神经网络提取灰度像图像的节点特征,并使用灰度特征构建二型模糊分类网络,对模糊规则进行筛选以达到较高的设备识别精度。但当设备数目多的时候,仍然会造成较大的数据采集开销,即数据采集源头的开销仍然存在。另外,二型模糊分类网络可能需要更多的计算资源和时间来处理更高维度、更复杂的数据,而且可能存在过拟合或欠拟合的风险,且建模成灰度图像可能会损失一些环保设备波形数据的细节信息,而且可能受到噪声或干扰的影响,造成识别精度不佳。
[0006]与此同时,还有一种基于图神经网络的电力物联网设备异常检测方法。这种方法使用图神经网络进行物联网设备的异常检测,在数据采集源头仍然需要完整的收集电力物联网中不同设备的流量数据和业务数据,当入网的设备数目多的时候,仍然会造成较大的数据采集开销,给数据采集源,例如网关,造成大的负担,进一步影响其作为网络转发设备的基础功能。

技术实现思路

[0007]本专利技术所要解决的技术问题是,针对现有技术不足,提供一种基于流量采样的设备类型识别方法、终端设备和存储介质,解决传统基于设备流量特征的设备识别方法依赖于在网关处采集与存储完整的设备流量,网关计算负担和存储压力大,导致设备识别方法鲁棒性和实用性差的问题。
[0008]为解决上述技术问题,本专利技术所采用的技术方案是:一种基于流量采样的设备类型识别方法,包括以下步骤:
[0009]S1、对物联网设备进行间断的数据包采集;
[0010]S2、提取采集的数据包的特征,得到各个数据包的特征向量,所有数据包的特征向量堆叠形成三阶稀疏张量,利用所述三阶稀疏张量构建二分图G={Vm,Vw,E},其中二分图的左节点集合Vm为设备集合,右节点集合Vw为数据包测量窗口集合,左节点集合与右节点集合之间的边集E为特征集合;
[0011]S3、将所述二分图作为设备识别模型的输入,得到更新后的设备识别模型。
[0012]本专利技术仅需在网关处进行流量的采样即可进行基于设备流量特征的设备识别,不需要采集完整的设备流量,因此减轻了测量成本和存储压力,能够解决现有基于流量特征的设备识别方法开销大、实用性差的问题,降低了识别成本。
[0013]本专利技术中,步骤S1的具体实现过程包括:
[0014]设置多个测量窗口;
[0015]随机选择部分测量窗口,采集选择的测量窗口内的设备流量。
[0016]步骤S3中,所述设备识别模型包括:
[0017]第一图神经网络消息传递层,用于对输入的二分图进行第一次图信息传递,更新二分图中节点、边的向量表征;
[0018]第二图神经网络消息传递层,用于根据第一图神经网络消息传递层输出的二分图中的2跳邻居关系,更新第一图神经网络消息传递层输出的二分图中的节点、边的向量表征;
[0019]缺失特征补全层,用于根据第二图神经网络消息传递层输出的二分图中的节点信息,估计缺失的特征边,并输出补全后的特征边集合;
[0020]卷积单元,用于对补全后的特征边集合进行卷积操作;
[0021]线性输出层,输入为拼接特征,输出为设备的类别;所述拼接特征获取过程包括:对卷积单元输出的特征进行展平操作,拼接展平操作后的特征与第二图神经网络消息传递层输出的节点向量,得到所述拼接特征。
[0022]本专利技术以归纳的方式学习如何生成嵌入,而不是学习嵌入本身,能有效、快速的补全设备未采样流量的行为特征,且能应对新到来的设备,从而更满足设备识别的场景,提高了设备类型识别精度。
[0023]所述第一图神经网络消息传递层更新二分图中节点、边的向量表征的具体实现过程包括:
[0024]通过下式构造第1次图信息传递中构建节点v的邻居聚合向量
[0025][0026]N(v)为v的邻居节点集合,为节点v的邻居节点。为节点v的1跳邻居节点u的初始向量表征,为边uv的初始向量表征,CONCAT(
·
)表示拼接操作,Mean{
·
}为均值聚合函数,ReLU(
·
)为非线性激活函数,为第1次图信息传递中,构造过程的可学习参数;
[0027]利用下式更新节点向量表征:其中,为节点v在第1次图信息传递中更新的表征向量,为第1次图信息传递中,节点表征更新过程的可学习参数;
[0028]利用下式更新边向量表征:其中,为边uv在第1次图信息传递中更新的表征向量,为第1次图信息传递中,边表征更新过程的可学习参数。
[0029]通过第1次的图信息传递,图中的每一个节点更新一次,它的表征能够捕捉到其一阶展开的邻居子树结构的复杂特征和模式,例如节点的度数、邻居的属性分布、邻居之间的连接关系等。这些特征和模式可以反映节点在图中的位置和角色,以及节点与邻居之间的相似性和差异性。第二图神经网络消息传递层更新第一图神经网络消息传递层输出的二分图中的节点、边的向量表征的具体实现过程包括:
[0030]通过下式构造第2次图信息传递中节点v的邻居聚合向量通过下式构造第2次图信息传递中节点v的邻居聚合向量通过下式构造第2次图信息传递中节点v的邻居聚合向量为节点u在第1次图信息传递中的向量表征,为第2次图信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于流量采样的设备类型识别方法,其特征在于,包括以下步骤:S1、对物联网设备进行间断的数据包采集;S2、提取采集的数据包的特征,得到各个数据包的特征向量,所有数据包的特征向量堆叠形成三阶稀疏张量,利用所述三阶稀疏张量构建二分图G={Vm,Vw,E},其中二分图的左节点集合Vm为设备集合,右节点集合Vw为数据包测量窗口集合,左节点集合与右节点集合之间的边集E为特征集合;S3、将所述二分图作为设备识别模型的输入,得到更新后的设备识别模型。2.根据权利要求1所述的基于流量采样的设备类型识别方法,其特征在于,步骤S1的具体实现过程包括:设置多个测量窗口;随机选择部分测量窗口,采集选择的测量窗口内的设备流量。3.根据权利要求1所述的基于流量采样的设备类型识别方法,其特征在于,步骤S3中,所述设备识别模型包括:第一图神经网络消息传递层,用于对输入的二分图进行第一次图信息传递,更新二分图中节点、边的向量表征;第二图神经网络消息传递层,用于根据第一图神经网络消息传递层输出的二分图中的2跳邻居关系,更新第一图神经网络消息传递层输出的二分图中的节点、边的向量表征;缺失特征补全层,用于根据第二图神经网络消息传递层输出的二分图中的节点信息,估计缺失的特征边,并输出补全后的特征边集合;卷积单元,用于对补全后的特征边集合进行卷积操作;线性输出层,输入为拼接特征,输出为设备的类别;所述拼接特征获取过程包括:对卷积单元输出的特征进行展平操作,拼接展平操作后的特征与第二图神经网络消息传递层输出的节点向量,得到所述拼接特征。4.根据权利要求3所述的基于流量采样的设备类型识别方法,其特征在于,所述第一图神经网络消息传递层更新二分图中节点、边的向量表征的具体实现过程包括:通过下式构造第1次图信息传递中构建节点v的邻居聚合向量通过下式构造第1次图信息传递中构建节点v的邻居聚合向量N(v)为节点v的邻居节点集合,为节点v的邻居节点,为节点v的1跳邻居节点u的初始向量表征,为边uv的初始向量表征,CONCAT(
·
)表示拼接操作,Mean{
·
}为均值聚合函数,ReLU(
·
)为非线性激活函数,为第1次图信息传递中,构造过程的可学习参数;利用下式更新节点向量表征:其中,为节点v在第1次图信息传递中更新的表征向量,为第1次图信息传递中,节...

【专利技术属性】
技术研发人员:王浩轩谢鲲文吉刚
申请(专利权)人:湖南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1