一种无线局域网络流量分析的方法和系统技术方案

技术编号:24252251 阅读:14 留言:0更新日期:2020-05-22 23:56
本发明专利技术提供的一种无线局域网络流量分析的方法和系统,利用射频识别技术根据设备射频指纹特征唯一确定设备;应用设备的指纹特征作为设备的识别标识,而不使用MAC、IP等用户敏感数据作为识别标识,在很大程度上保护了用户的隐私;基于机器学习,采用ReliefF算法对采集数据的参数向量进行特征选择,利用PCA算法对特征向量降维,最后采用K近邻算法进行分类标识,这样在减少测试训练时间的同时又提高了设备的识别速度及准确率。

A method and system of wireless LAN traffic analysis

【技术实现步骤摘要】
一种无线局域网络流量分析的方法和系统
本专利技术涉及媒体通信
,尤其涉及一种无线局域网络流量分析的方法和系统。
技术介绍
现有的WIFI网络流量分析中识别一个设备的方式一般采用wifi探针技术。wifi探针实际上指的是probe帧。我们一般接入无线网络的时候,首先要选择对应的无线网路,即根据无线网络的名字进行选择(SSID)。那么知道这个名字有两种方式,主动扫描和被动扫描,其中probe帧即是用在主动扫描这种技术中。设备节点主动发送proberequest帧给AP(也就是路由),AP然后反馈proberesponse,然后利用该帧中的一些信息,节点继续完成WIFI网络接入过程。通过这种方式,AP可以“收集”用户的信息。probe帧是用以让节点收集AP的信息的,但是AP实际上也可以用来收集节点的mac地址信息。一般的做法是在一个商业店铺中部署一个AP,用该AP将一天中所有的proberequest帧的信息全部按照时序进行收集,然后就可以对这些数据进行分析,比如什么时候客人最多,什么时候回头客最多之类,由于手机具有唯一的mac地址,所以就可以利用probe帧提供的信息做一些大数据的分析。若AP部署的较广的情况下,那么收集的信息能更多,从而可以对客户进行定位和轨迹分析。但是由于以太网规定mac地址是唯一的,而一般mac地址会标注在出售的手机或者电脑上,也就是说通过mac地址能够确认某个手机终端或者电脑,但wifi探针技术是在用户未授权的情况下进行的流量捕获和分析,侵犯了用户的隐私。手机厂商为了保护用户隐私,提供几种方法:1)关闭IP地址和MAC地址的获取2)在扫描Wi-Fi时使用随机的、本地管理的MAC地址。现有的技术是在用户未授权的情况下进行的流量捕获和分析,侵犯了用户的隐私。手机厂商推出的关闭获取mac地址和随机mac地址的方式导致现有的技术进行流量分析的时候不准确,无法实现商户的需求。在一种现有技术中,公开了一种无线网接入认证系统和方法。该方法包括以下步骤:接收合法同相正交信号,获得星座轨迹图,划分星座轨迹图,计算聚类中心,生成射频指纹特征向量,建立射频指纹特征向量白名单,录入合法用户信息,提取生物指纹特征,建立生物指纹特征白名单,发送连接认证请求,提取待认证射频指纹特征向量,计算相似度,录入待认证用户信息,提取待认证生物指纹,加密待认证生物指纹,解密密文,加解密同步序列数,计算哈希值,校验哈希值(允许或拒绝接入无线网络)。该方法存在不足之处:1.每一个合法用户都需要加入射频指纹特征向量白名单,当用户数量变大或者用户群体经常变化的情况下,更新射频指纹特征向量白名单及白名单的用户管理将成为难题,频繁变化的合法用户给白名单管理增添了更多的工作量。2.合法用户的唯一性需要射频指纹特征和合法用户生物指纹特征共同保证,如若出现合法用户更换设备,有可能出现射频指纹特征不在白名单中导致该合法用户无法接入无线网络。3.整个系统干预过程需要录入用户信息和生物指纹,相当于获取了用户的部分隐私信息,关于隐私信息的保护增加了系统的负担,隐私信息的安全性也成了整个系统被攻击的切入点。该系统主要包括:射频模块,射频指纹处理模块,指纹信息存储模块,连接认证请求发送模块,连接认证请求处理模块,用户信息处理模块,指纹信息验证模块,接入服务模块。该系统存在不足之处,该系统收集了设备射频信号,并进行了射频指纹特征提取,但缺乏设备射频指纹特征的分类,如相同厂商的设备射频指纹是否具有相似之处,或者不同厂商的设备的射频指纹差异。在第二种现有技术中公开了一种基于射频指纹和信道信息的物理层联合认证方法,其认证步骤首先是进行射频指纹的认证,射频指纹认证成功后再进行基于无线信道信息的认证,认证采用计算特征向量相似度的方式,人工设定阈值,高于阈值则认证成功,低于阈值则认证失败。此专利虽然具有延时小,复杂度低的特定,但是需要人工设定阈值,阈值的选取具有一定的难度。在第三种现有技术中,所采用的原理是基于两个合法设备通信过程中所呈现出的射频指纹特征,将合法发送方的射频指纹特征作为判别依据的射频指纹特征向量样本,然后对未知发送方的射频指纹特征进行提取并与射频指纹特征向量进行对比,若不低于预设阈值则该未知设备为合法设备并将其射频指纹特征向量存储进判别样本,否则判断为非法设备;此方案存在以下两点不足:1.未对合法设备射频指纹数据未进行有效处理,直接使用原始数据的处理结果作为样本集,与本文方案相比,本文方案采用ReliefF算法对采集数据的参数向量进行特征选择,利用PCA算法消除特征列之间的相关性,实现数据绛维,在识别效率上更高效。2.此方案初期采用一定量合法设备指纹数据作为基础样本,而后随着识别设备的增多,不断将已识别设备指纹数据加入样本,这就导致初期的识别准确率不高,而本文方案则是基于机器学习,将大量合法设备的射频指纹特征作为训练集,最后采用K近邻算法进行分类标识,对于未知设备的接入利用其指纹特征即可快速判别其合法性,不需要对判别为合法设备的指纹特征进行存储。
技术实现思路
本专利技术的实施例提供了一种无线局域网络流量分析的方法和系统,用于解决现有技术中存在的问题。为了实现上述目的,本专利技术采取了如下技术方案。一种无线局域网络流量分析的方法,包括:间隔获取射频信号;对射频信号进行转换处理,提取射频信号的射频指纹,并获得参数向量集;基于机器学习和该参数向量集,对射频指纹进行分类标识。优选地,对射频信号进行转换处理,提取射频信号的射频指纹,并获得参数向量集包括:对射频信号依次进行信号解调、信号分离、信号解码、数据解码和参数量化,获得参数向量集。优选地:对射频信号进行信号解调包括,对射频信号进行检波和滤波,获得射频信号的模拟信号量集;对射频信号进行信号分离包括,将模拟信号量集进行分离获得多个模拟信号量;对射频信号进行信号解码包括,对多个模拟信号量进行解码,获得数字信号量;对射频信号进行数据解码包括,基于数字信号量进行提取获得数据信息量;对射频信号进行参数量化包括,对模拟信号量和数据信息量进行参数量化,获得参数向量集。优选地,基于机器学习和该参数向量集,对射频指纹进行分类标识包括:通过ReliefF算法对参数向量集进行特征选择,获得多个数据特征;通过PCA算法对该多个数据特征进行降维处理,获得降维特征;通过K近邻算法对降维特征进行分类标识。优选地,通过ReliefF算法对参数向量集进行特征选择,获得数据特征包括:对参数向量集的参数向量进行分类处理,并随机获取一个样本数据特征;在该参数向量样本所属的分类单位内,获取一个或多个最近邻数据特征;在其它的分类单位中,获取一个或多个次近邻数据特征;分别计算样本数据特征、每个最近邻数据特征和每个次近邻数据特征的权重。优选地,通过K近邻算法对降维特征进行分类标识包括:输入预设的训练数据本文档来自技高网
...

【技术保护点】
1.一种无线局域网络流量分析的方法,其特征在于,包括:/n间隔获取射频信号;/n对射频信号进行转换处理,提取射频信号的射频指纹,并获得参数向量集;/n基于机器学习和该参数向量集,对射频指纹进行分类标识。/n

【技术特征摘要】
1.一种无线局域网络流量分析的方法,其特征在于,包括:
间隔获取射频信号;
对射频信号进行转换处理,提取射频信号的射频指纹,并获得参数向量集;
基于机器学习和该参数向量集,对射频指纹进行分类标识。


2.根据权利要求1所述的方法,其特征在于,所述的对射频信号进行转换处理,提取射频信号的射频指纹,并获得参数向量集包括:
对射频信号依次进行信号解调、信号分离、信号解码、数据解码和参数量化,获得参数向量集。


3.根据权利要求2所述的方法,其特征在于:
所述的对射频信号进行信号解调包括,对射频信号进行检波和滤波,获得射频信号的模拟信号量集;
所述的对射频信号进行信号分离包括,将模拟信号量集进行分离获得多个模拟信号量;
所述的对射频信号进行信号解码包括,对多个模拟信号量进行解码,获得数字信号量;
所述的对射频信号进行数据解码包括,基于数字信号量进行提取获得数据信息量;
所述的对射频信号进行参数量化包括,对模拟信号量和数据信息量进行参数量化,获得参数向量集。


4.根据权利要求1所述的方法,其特征在于,所述的基于机器学习和该参数向量集,对射频指纹进行分类标识包括:
通过ReliefF算法对参数向量集进行特征选择,获得多个数据特征;
通过PCA算法对该多个数据特征进行降维处理,获得降维特征;
通过K近邻算法对降维特征进行分类标识。


5.根据权利要求4所述的方法,其特征在于,所述的通过Relie...

【专利技术属性】
技术研发人员:陈海滨崔泽鹏邹俊伟刘杰杨亚荣
申请(专利权)人:北京百卓网络技术有限公司北京邮电大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1