【技术实现步骤摘要】
基于wifi指纹信息的设备识别系统
本专利技术涉及计算机
,尤其涉及一种基于wifi指纹信息的设备识别系统。
技术介绍
小程序是指一种基于特定编程语言开发完成,无需下载和安装,就可以使用的应用。小程序的特点是使用便捷,无需手动在操作系统中安装。通常小程序依托于终端中的大型应用作为载体进行使用。小程序只能识别到活跃行为,获取活跃行为对应的wifi连接信息,但不能识别出打开小程序的设备id。但随着大数据时代的到来和小程序活跃用户的激增,小程序所获取到是数据量也是巨大的。如果要对小程序进行进一步开发和分析,是很有必要基于小程序的海量数据确定使用小程序的设备信息,然后可以基于设备信息对应的特征参数来分析群体特征等。由此可知,如何识别使用小程序的设备成为亟待解决的技术问题。
技术实现思路
本专利技术目的在于,提供一种基于wifi指纹信息的设备识别系统,能够快速准确地从海量数据中识别出小程序的wifi指纹信息对应的设备gid。根据本专利技术第一方面,提供了一种基于wifi指纹信息的设备识别系统,包括第一数据库、第二数据库、存储有计算机程序的存储器和处理器,其中,所述第一数据库用于存储设备wifi指纹记录,所述设备wifi指纹记录包括设备gid、设备wifi指纹信息和第一地理位置信息字段,其中,所述设备wifi指纹信息是设备gid所连接的wifimac按照时间顺序排序所产生的wifimac序列,每一wifimac对应一个上报时间戳,所述gid是设备的全局唯一标识;所述第二数据库用于 ...
【技术保护点】
1.一种基于wifi指纹信息的设备识别系统,其特征在于,/n包括第一数据库、第二数据库、存储有计算机程序的存储器和处理器,其中,/n所述第一数据库用于存储设备wifi指纹记录,所述设备wifi指纹记录包括设备gid、设备wifi指纹信息和第一地理位置信息字段,其中,所述设备wifi指纹信息是设备gid所连接的wifi mac按照时间顺序排序所产生的wifi mac序列,每一wifi mac对应一个上报时间戳,所述gid是设备的全局唯一标识;/n所述第二数据库用于存储小程序wifi指纹记录,所述小程序wifi指纹记录包括设备cid、小程序wifi指纹信息和第二地理位置信息字段,其中,每一cid在所述第二数据库中是唯一的,但不同cid对应的设备为相同的设备或不同的设备,所述小程序wifi指纹信息是指同一设备运行同一小程序所连接的wifi mac按照时间顺序排序所产生的wifi mac序列,每一wifi mac对应一个上报时间戳;/n所述处理器执行所述计算机程序实现以下步骤:/n步骤S1、以预设的时间窗在所述第一数据库中获取预设地理区域范围内的M个时间窗内每一设备gid的设备wifi指纹信息
【技术特征摘要】
1.一种基于wifi指纹信息的设备识别系统,其特征在于,
包括第一数据库、第二数据库、存储有计算机程序的存储器和处理器,其中,
所述第一数据库用于存储设备wifi指纹记录,所述设备wifi指纹记录包括设备gid、设备wifi指纹信息和第一地理位置信息字段,其中,所述设备wifi指纹信息是设备gid所连接的wifimac按照时间顺序排序所产生的wifimac序列,每一wifimac对应一个上报时间戳,所述gid是设备的全局唯一标识;
所述第二数据库用于存储小程序wifi指纹记录,所述小程序wifi指纹记录包括设备cid、小程序wifi指纹信息和第二地理位置信息字段,其中,每一cid在所述第二数据库中是唯一的,但不同cid对应的设备为相同的设备或不同的设备,所述小程序wifi指纹信息是指同一设备运行同一小程序所连接的wifimac按照时间顺序排序所产生的wifimac序列,每一wifimac对应一个上报时间戳;
所述处理器执行所述计算机程序实现以下步骤:
步骤S1、以预设的时间窗在所述第一数据库中获取预设地理区域范围内的M个时间窗内每一设备gid的设备wifi指纹信息i=1,2,…X,X为M个时间窗内所涉及的所有设备gid去重后的总数量,表示第i设备gid在第m时间窗内的设备wifi指纹信息,m的取值为1到M;
步骤S2、以所述预设时间窗在所述第二数据库中获取所述预设地理区域范围内的对应的M个时间窗内每一设备cid的小程序wifi指纹信息j=1,2,…Y,Y为M个时间窗内所涉及的所有设备cid的总数量,表示第j设备cid在第m时间窗内的小程序wifi指纹信息,m的取值为1到M;
步骤S3、将和分别转换为对应的TF-IDF向量和i的取值为1到X,j的取值为1到Y,m的取值为1到M;
步骤S4、获取和的向量相似度,基于和的向量相似度确定每一设备cid所对应的设备gid。
2.根据权利要求1所述的系统,其特征在于,
优选的,所述步骤S3之前还包括:
步骤S100、将和中wifimac的信号强度小于预设信号强度阈值的wifimac删除;
和/或,
步骤S200、将和中wifimac在预设时间内连接设备数量超过预设连接数量阈值的wifimac删除。
3.根据权利要求2所述的系统,其特征在于,
优选的,所述信号强度阈值为-70dbm。
4.根据权利要求1或2所述的系统,其特征在于,
优选的,所述步骤S3包括:
步骤S31、获取和中出现的每一wifimac的IF-IDF值;
步骤S32、构建TF-IDF向量框架(v1,v2…vN),N表示和中出现的所有wifimac去重后的总数;
步骤S33、判断中是否存在第n个wifimac,若存在,则将TF-IDF向量框架(v1,v2…vN)中的vn设置为第n个wifimac的TF-IDF值,若不存在,则量TF-IDF向量框架(v1,v2…vN)中的vn设置为零,n取值为1到N,从而生成对应的TF-IDF向量
判断中是否存在第n个wif...
【专利技术属性】
技术研发人员:段五福,方毅,章玉珍,董霖,王杰,
申请(专利权)人:每日互动股份有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。