一种基于WIFI探针与摄像头技术的数据分析方法技术

技术编号:20363319 阅读:43 留言:0更新日期:2019-02-16 16:43
本发明专利技术涉及数据分析技术领域,具体公开了一种基于WIFI探针与摄像头技术的数据分析方法,包括以下步骤:S100:建立人像数据库和WiFi探针数据库,根据人像数据库和WiFi探针数据库建立人像数据对象和WiFi数据对象;S200:生成时间窗口键值对序列,预定义时间窗口并以时间窗口为键,建立人像数据时间窗口键值对序列和WiFi数据时间窗口键值对序列;S300:将上述两个时间窗口键值对序列进行关联并映射为联合事务集;S400:对联合事务集进行频繁项集挖掘,得到频繁项集结果并筛选出目标结果。本发明专利技术提供的一种基于WIFI探针与摄像头技术的数据分析方法,能够建立WiFi探针扫描到的MAC数据与被抓拍的人像之间一一对应关系,并将其抽象为一种数据挖掘模型以供后续分析使用。

【技术实现步骤摘要】
一种基于WIFI探针与摄像头技术的数据分析方法
本专利技术涉及数据分析
,具体为一种基于WIFI探针与摄像头技术的数据分析方法。
技术介绍
WIFI探针作为一种成熟的技术,其基本原理是,当移动设备用户开启无线连接并进入到WIFI探针的扫描范围内,其发送出的数据可被探针截获并能分析出此数据帧MAC层与物理层的一些信息,如发送与接收设备的MAC地址、帧类型、信号强度等。目前,在特定场景部署若干个WIFI探针,可以实现对于该场景的客流统计分析、实时热力分析、员工考勤打卡等功能。当前对于WIFI探针技术的利用,仅仅能够获取特定场景的到访总数、实时热力情况,即使知道某个MAC地址,由于WIFI探针数据的单一性,并不能反映出该MAC对应人员的全貌信息。无法将不同对象的空间、时间信息进行匹配,如果能够将WiFi探针技术与人脸识别技术相结合,则其存在着潜在的巨大应用价值,如何找出被探针扫描到的MAC与被抓拍的人像一一对应关系,并将其抽象为一种数据挖掘模型,是实现WiFi探针技术与人脸识别技术融合的关键,目前尚未有相关技术的文献公开。
技术实现思路
本专利技术意在提供一种基于WIFI探针与摄像头技术的数据分析方法,能够建立WiFi探针扫描到的MAC数据与被抓拍的人像之间一一对应关系,并将其抽象为一种数据挖掘模型以供后续分析使用。为了解决上述技术问题,本申请提供如下技术方案:一种基于WIFI探针与摄像头技术的数据分析方法,包括以下步骤:S100:建立人像数据库和WiFi探针数据库,根据人像数据库和WiFi探针数据库建立人像数据对象和WiFi数据对象;S200:生成时间窗口键值对序列,预定义时间窗口并以时间窗口为键,分别以该时间窗口内出现的人像数据对象组成的列表和该时间窗口内出现的WiFi数据对象组成的列表为值,建立人像数据时间窗口键值对序列和WiFi数据时间窗口键值对序列;S300:将S200中得到的人像数据时间窗口键值对序列和WiFi数据时间窗口键值对序列进行关联并映射为联合事务集;S400:设定支持度阈值参数,对S300中得到的联合事务集进行频繁项集挖掘,得到频繁项集结果,从频繁项集结果中筛选出只包含一个人像数据对象和一个WiFi数据对象的结果;S500:对S400中筛选出来的结果进行唯一性校验,如果满足唯一性,则结束计算,如果不满足唯一性,则返回S400步骤,并调整支持度阈值参数重新进行计算。本专利技术技术方案中,首先获取并建立人像数据库以及WiFi探针数据库,通过设置时间窗口,将人像数据和WiFi探针数据按照时间窗口进行映射,形成人像数据时间窗口键值对序列和WiFi数据时间窗口键值对序列,然后融合两个键值对序列为一个联合事务集,通过频繁项集挖掘算法对该联合事务集进行挖掘,得到频繁项集结果,频繁模式是指数据集中频繁出现的项集、序列或子结构,然后从该结果中筛选出符合规则的结果,就可以得到WiFi数据与人像数据之间的对应关系,然后再通过唯一性校验得到两者的一一对应关系。本申请中,通过将WIFI探针扫描数据和摄像头抓拍照片数据转换为数据挖掘模型适用的数据,应用数据挖掘技术,找出WiFi数据和人像照片之间一一对应的关系。在实际应用中,仅仅知道的一种设备的数据是无法得到某个人的全貌信息的,WiFi数据和人像数据互为补充,可以获取某人静态的特征信息和动态的轨迹信息,在商场精准营销、公安抓捕等很多方面有较大的应用前景。进一步,S100具体包括以下步骤:S100-1:根据抓拍的路人照片库,建立目标人像库;S100-2:为目标人像库中每一个人设置ID;S100-3:根据目标人像库对路人照片库中的人像进行识别,根据识别结果建立人像数据库,人像数据库的字段包括人像ID、相似度以及抓拍时间戳;S100-4:获取WiFi探针的扫描结果,根据扫描结果建立WiFi探针数据库,WiFi探针数据库的字段包括MAC地址、信号强度以及扫描时间戳;S100-5:根据人像数据库建立人像数据对象;S100-6:根据WiFi探针数据库建立WiFi数据对象。首先建立路人照片库,然后再在路人照片库中选择需要识别和关联的人群建立人像数据库,通过WiFi探针获取扫描结果并建立WiFi探针数据库。进一步,S100-3中建立人像数据库时会对识别结果进行筛选,从识别结果中筛选出相似度大于相似度阈值的人像数据,S100-4中建立WiFi探针数据库时会对扫描结果进行筛选,从扫描结果中筛选出信号强度大于信号强度阈值的WiFi探针数据。通过相似度阈值和信号强度阈值对人像数据和WiFi探针数据进行过滤,去除信号不好的WiFi探针数据或者识别率不高的人像数据,增加数据分析正确率。进一步,S200具体包括以下步骤:S200-1:定义一个时间窗口时长为N分钟;S200-2:加载人像数据库和WiFi探针数据库,分别将抓拍时间戳和扫描时间戳映射为时间窗口的形式;S200-3:将人像数据库映射为以抓拍时间戳对应的时间窗口为键,该时间窗口内所有人像数据对象组成的列表为值的人像数据时间窗口键值对序列;S200-4:将WiFi探针数据库映射为以扫描时间戳对应的时间窗口为键,该时间窗口内所有WiFi数据对象组成的列表为值的WiFi数据时间窗口键值对序列。首先定义时间窗口的时长,然后将抓拍时间戳和扫描时间戳映射为时间窗口的形式,最后建立相应的键值对序列,实现人像数据库和WiFi探针数据库的键值对映射转化。进一步,S200-3和S200-4中采用Spark的reduceByKey算子进行键值对序列的映射。Spark是专为大规模数据处理而设计的快速通用的计算引擎,实现了高效的DAG执行引擎,可以通过内存方式来高效地处理数据流。进一步,S300中联合事务集以时间窗口为键,以人像数据对象列表和WiFi数据对象列表拼接成的列表为值。进一步,S300中采用Spark的join算子对人像数据时间窗口键值对序列和WiFi数据时间窗口键值对序列进行关联。通过Spark的算子快速而高效的将数据进行关联。进一步,S400具体包括以下步骤:S400-1:设置支持阈值,以S300中得到的联合事务集为参数,调用频繁项集挖掘算子进行频繁项集挖掘,得到频繁项集结果;S400-2:对频繁项集结果进行过滤,过滤出每项事务列表中只包括一个人像数据对象和一个WiFi数据对象的子集作为结果。进一步,S400-1中采用的挖掘算子是Spark的FPGrowth算子。通过Spark的FPGrowth对数据进行频繁项集挖掘,计算效率高,处理速度快。附图说明图1为本专利技术一种基于WIFI探针与摄像头技术的数据分析方法实施例中的流程图。具体实施方式下面通过具体实施方式进一步详细说明:如图1所示,本实施例的一种基于WIFI探针与摄像头技术的数据分析方法,包括以下步骤:S100:建立人像数据库和WiFi探针数据库,根据人像数据库和WiFi探针数据库建立人像数据对象和WiFi数据对象;S200:生成时间窗口键值对序列,预定义时间窗口并以时间窗口为键,分别以该时间窗口内出现的人像数据对象组成的列表和该时间窗口内出现的WiFi数据对象组成的列表为值,建立人像数据时间窗口键值对序列和WiFi数据时间窗口键值对序列;S300:将S200中得到的人像数据时间窗口键值对序列本文档来自技高网...

【技术保护点】
1.一种基于WIFI探针与摄像头技术的数据分析方法,其特征在于:包括以下步骤:S100:建立人像数据库和WiFi探针数据库,根据人像数据库和WiFi探针数据库建立人像数据对象和WiFi数据对象;S200:生成时间窗口键值对序列,预定义时间窗口并以时间窗口为键,分别以该时间窗口内出现的人像数据对象组成的列表和该时间窗口内出现的WiFi数据对象组成的列表为值,建立人像数据时间窗口键值对序列和WiFi数据时间窗口键值对序列;S300:将S200中得到的人像数据时间窗口键值对序列和WiFi数据时间窗口键值对序列进行关联并映射为联合事务集;S400:设定支持度阈值参数,对S300中得到的联合事务集进行频繁项集挖掘,得到频繁项集结果,从频繁项集结果中筛选出只包含一个人像数据对象和一个WiFi数据对象的结果;S500:对S400中筛选出来的结果进行唯一性校验,如果满足唯一性,则结束计算,如果不满足唯一性,则返回S400步骤,并调整支持度阈值参数重新进行计算。

【技术特征摘要】
1.一种基于WIFI探针与摄像头技术的数据分析方法,其特征在于:包括以下步骤:S100:建立人像数据库和WiFi探针数据库,根据人像数据库和WiFi探针数据库建立人像数据对象和WiFi数据对象;S200:生成时间窗口键值对序列,预定义时间窗口并以时间窗口为键,分别以该时间窗口内出现的人像数据对象组成的列表和该时间窗口内出现的WiFi数据对象组成的列表为值,建立人像数据时间窗口键值对序列和WiFi数据时间窗口键值对序列;S300:将S200中得到的人像数据时间窗口键值对序列和WiFi数据时间窗口键值对序列进行关联并映射为联合事务集;S400:设定支持度阈值参数,对S300中得到的联合事务集进行频繁项集挖掘,得到频繁项集结果,从频繁项集结果中筛选出只包含一个人像数据对象和一个WiFi数据对象的结果;S500:对S400中筛选出来的结果进行唯一性校验,如果满足唯一性,则结束计算,如果不满足唯一性,则返回S400步骤,并调整支持度阈值参数重新进行计算。2.根据权利要求1所述的一种基于WIFI探针与摄像头技术的数据分析方法,其特征在于:S100具体包括以下步骤:S100-1:根据抓拍的路人照片库,建立目标人像库;S100-2:为目标人像库中每一个人设置ID;S100-3:根据目标人像库对路人照片库中的人像进行识别,根据识别结果建立人像数据库,人像数据库的字段包括人像ID、相似度以及抓拍时间戳;S100-4:获取WiFi探针的扫描结果,根据扫描结果建立WiFi探针数据库,WiFi探针数据库的字段包括MAC地址、信号强度以及扫描时间戳;S100-5:根据人像数据库建立人像数据对象;S100-6:根据WiFi探针数据库建立WiFi数据对象。3.根据权利要求2所述的一种基于WIFI探针与摄像头技术的数据分析方法,其特征在于:S100-3中建立人像数据库时会对识别结果进行筛选,从识别结果中筛选出相似度大于相似度阈值的人像数据,S100-4中建立WiFi探针...

【专利技术属性】
技术研发人员:马元丁双安
申请(专利权)人:元力云网络有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1