System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于联邦学习和行为分析的物联网设备识别方法技术_技高网
当前位置: 首页 > 专利查询>河北大学专利>正文

基于联邦学习和行为分析的物联网设备识别方法技术

技术编号:41399844 阅读:6 留言:0更新日期:2024-05-20 19:24
本发明专利技术公开了基于联邦学习和行为分析的物联网设备识别方法,S1.建立联邦学习框架;S2.获取第一原始流量数据,对第一原始流量数据进行预处理;S3.将预处理后的第一原始流量数据转换为数据集,对数据集进行特征提取;S4.根据周期特征和协议特征构造出第一原始流量数据对应的指纹矩阵;S5.将第一原始流量数据对应的指纹矩阵输入LSTM,得到本地模型;S6.获取第二原始流量数据,对第二原始流量数据依次进行预处理、转换为数据集和特征提取,构造出第二原始流量数据对应的指纹矩阵,将指纹矩阵输入本地模型进行识别得到识别结果,并根据识别结果对本地模型进行更新。本发明专利技术将联邦学习、周期性特征提取和LSTM算法的结合提供一个鲁棒性和适应性强的设备识别方法。

【技术实现步骤摘要】

本专利技术涉及一种设备识别方法,具体地说是一种基于联邦学习和行为分析的物联网设备识别方法


技术介绍

1、与本专利技术最相近的现有技术是samuel marchal等人构想的audi识别框架。奥迪通过从流量数据头中提取反映正常协议行为的周期性特征来解决物联网设备识别问题。这些通信标记被馈送到从各种环境聚合的集中式k-最近邻(knn)分类器模型中。虽然audi在聚合同类型物联网设备方面表现出了不错的效果,但它也有一些关键的局限性。

2、首先,集中式建模方法面临可伸缩性和隐私风险,特别是在扩展实际部署时。audi方案采用基于组的识别策略,将设备分类,并进行集体处理。这种方法可能会忽略类型中各个设备之间的细粒度区别,从而限制了设备标识的精度。其次,跨设备实例的后台进程的变化在唯一识别单个物联网端点时降低了可靠性。单一模型也容易受到概念漂移的影响。虽然对同一类别的设备有效,但随着不同物联网设备类型的数量增加,这种方法可能会遇到可扩展性问题。


技术实现思路

1、本专利技术的目的就是提供一种基于联邦学习和行为分析的物联网设备识别方法,以解决现有技术对物联网设备识别时隐私性弱、可扩展性低以及识别精度低的问题。

2、本专利技术目的是这样实现的:

3、一种基于联邦学习和行为分析的物联网设备识别方法,包括:

4、s1.建立联邦学习框架;

5、s2.获取第一原始流量数据,对第一原始流量数据进行预处理,所述第一原始流量数据为首次获取到的原始流量数据,所述原始流量数据包括数据包;

6、s3.将预处理后的第一原始流量数据转换为数据集,对数据集进行特征提取,所述特征包括周期特征和协议特征;

7、s4.根据周期特征和协议特征构造出第一原始流量数据对应的指纹矩阵;

8、s5.将第一原始流量数据对应的指纹矩阵输入lstm,得到本地模型;

9、s6.获取第二原始流量数据,对第二原始流量数据依次进行预处理、转换为数据集和特征提取,并根据提取后的特征构造出第二原始流量数据对应的指纹矩阵,将第二原始流量数据对应的指纹矩阵输入本地模型进行识别得到设备的识别结果,并根据识别结果对本地模型进行更新,所述第二原始流量数据为非首次获取到的原始流量数据。

10、通过联邦学习设备协作有助于模型开发,确保分散的方法,提高可扩展性并增强隐私保护。联邦学习过程涉及分布式边缘节点之间的协作模型构建。每个节点都在本地数据上独立训练,为全局模型提供见解。由于原始数据仍然是本地化的,因此隐私得到了保护。

11、进一步地,步骤s3中对预处理后的流量数据进行周期特征提取的具体方式为:

12、s3-1.将数据集进行周期特征提取;

13、s3-2.根据提取到的周期特征进行周期特征筛选。

14、进一步地,周期特征包括流量周期值以及流量周期值对应的ri和rni;

15、步骤s3-1中周期特征提取的具体方式为:

16、s3-11.将数据集转换为离散信号y(t);

17、s3-12.将离散信号y(t)转换为频域y(f),当y(fi)>y(fi-1),且y(fi)>y(fi+1)时,得到候选周期其中,y(fi)为频率fi对应的幅度,y(fi-1)为频率fi-1对应的幅度,y(fi+1)为频率fi+1对应的幅度,d为y(t)的持续时间;

18、s3-13.根据自相关函数对候选周期进行更新,得到流量周期值ti;

19、s3-14.根据自相关函数计算流量周期值ti对应的ri和rni。

20、进一步地,对候选周期进行更新的具体方式为:

21、计算l的自相关函数:

22、

23、其中,ryy(l)为l的自相关函数,l是xi和xi+1间的时间差,xi表示时间索引为i时信号x的值,xi+1表示信号x在下次时间索引i+1处的值;

24、若ryy(li)>ryy(li-1),ryy(li)>ryy(li+1),且li满足则可以用更新,更新后的ti为最终得到的流量周期值。

25、进一步地,ri为:

26、

27、其中,ryy(ti)为ti的自相关函数,d为离散信号y(t)的持续时间,其中,n是y(t)的长度,y(t-ti)表示周期ti之前的信号;

28、rni为:

29、

30、其中,ryy(ti-1)为ti-1的自相关函数,其中,y(t-ti+1)表示周期ti-1之前的信号,ryy(ti+1)为ti+1的自相关函数,其中,y(t-ti-1)表示周期ti+1之前的信号。

31、进一步地,步骤s3-2中周期特征筛选的具体方式为:

32、s3-21.计算每个周期特征的chi值;

33、s3-22.根据所有周期特征的chi值,计算平均chi值和最大chi值;

34、s3-23.根据每个周期特征的chi值对提取的周期特征进行排序,将大于平均chi值的周期特征确定为筛选后的周期特征。

35、进一步地,每个周期特征的chi值为:

36、

37、其中,ci为类别,h为特征,n表示转换后的数据集总数;a表示有特征h且属于类别ci的数据集的个数;b表示有特征h但不属于类别ci的数据集的个数;c表示属于ci类但是没有特征h的数据集的个数;d表示既不属于类别ci且没有特征h的数据集的个数。

38、基于卡方验证选择特征可以减少过拟合,因为排除了可能导致过拟合的不相关或冗余特征。这提高了模型对新数据的泛化能力。与其他特征筛选方法相比,卡方验证具有计算效率,适用于大型数据集或实时应用,其中快速模型训练和预测是必不可少的。

39、进一步地,所述联邦学习框架包括两层,第一层为根节点,根节点为中央服务器,第二层为子节点,子节点为物联网设备。

40、进一步地,所述指纹矩阵为:

41、

42、其中,n是一个设备的n个数据包,15为从每个数据包中选取的15个特征。

43、本专利技术通过建立联邦学习框架,促进分布式边缘节点之间的协作模型开发,确保可扩展性并防止分散方法中的瓶颈,并通过原始数据进行本地模型训练来保护隐私,避免了将敏感信息传输到中央服务器的需要。在不损害隐私的情况下实现准确的设备识别。本专利技术还通过对单个物联网设备进行循环特征提取,专注于tcp和arp周期等属性,允许对单个物联网设备进行精确表征,提供了基于细粒度设备属性的更准确的识别方案。本专利技术还通过集成lstm算法使模型能够捕获顺序模式,确保其捕获和学习动态设备行为的作用得以保留,使其适应物联网设备随时间变化的动态和不断变化的行为,这与静态方法形成了对比,并确保了系统对不断变化的场景的适应性。本专利技术为现有物联网设备识别方法中遇到的挑战提供了整体解决方案,将联邦学习、周期性特征提取和lstm算法的结合提供一个鲁本文档来自技高网...

【技术保护点】

1.一种基于联邦学习和行为分析的物联网设备识别方法,其特征在于,包括:

2.根据权利要求1所述的基于联邦学习和行为分析的物联网设备识别方法,其特征在于,所述联邦学习框架包括两层,第一层为根节点,根节点为中央服务器,第二层为子节点,子节点为物联网设备。

3.根据权利要求1所述的基于联邦学习和行为分析的物联网设备识别方法,其特征在于,步骤S3中对预处理后的流量数据进行周期特征提取的具体方式为:

4.根据权利要求3所述的基于联邦学习和行为分析的物联网设备识别方法,其特征在于,周期特征包括流量周期值以及流量周期值对应的ri和rni;

5.根据权利要求4所述的基于联邦学习和行为分析的物联网设备识别方法,其特征在于,对候选周期进行更新的具体方式为:

6.根据权利要求4所述的基于联邦学习和行为分析的物联网设备识别方法,其特征在于,ri为:

7.根据权利要求3所述的基于联邦学习和行为分析的物联网设备识别方法,其特征在于,步骤S3-2中周期特征筛选的具体方式为:

8.根据权利要求7所述的基于联邦学习和行为分析的物联网设备识别方法,其特征在于,每个周期特征的CHI值为:

9.根据权利要求1所述的基于联邦学习和行为分析的物联网设备识别方法,其特征在于,所述指纹矩阵为:

...

【技术特征摘要】

1.一种基于联邦学习和行为分析的物联网设备识别方法,其特征在于,包括:

2.根据权利要求1所述的基于联邦学习和行为分析的物联网设备识别方法,其特征在于,所述联邦学习框架包括两层,第一层为根节点,根节点为中央服务器,第二层为子节点,子节点为物联网设备。

3.根据权利要求1所述的基于联邦学习和行为分析的物联网设备识别方法,其特征在于,步骤s3中对预处理后的流量数据进行周期特征提取的具体方式为:

4.根据权利要求3所述的基于联邦学习和行为分析的物联网设备识别方法,其特征在于,周期特征包括流量周期值以及流量周期值对应的ri和rni;

...

【专利技术属性】
技术研发人员:杜瑞忠李帅赵新龙李志强孟虎
申请(专利权)人:河北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1