The present application discloses a data processing method for identifying a target group by deploying a plurality of Wi_Fi probes within a preset area for identifying a device to be detected in the preset area and for obtaining detection data through the device to be detected. The method includes: receiving the detection data; and according to the preset data grid. The detection data are sorted into feature recognition data, and the feature recognition data are used as training features to train a recognition model of the target group, wherein the target group is used as a group of target sites entering a preset area. The application solves a technical problem in the prior art that there is a large error in judging the result of a particular group entering a target site by using unprocessed Wi_Fi signal data detected by a single Wi_Fi probe and empirical thresholds.
【技术实现步骤摘要】
用于识别目标群体的数据处理方法及装置
本申请涉及通信领域,具体而言,涉及一种用于识别目标群体的数据处理方法及装置。
技术介绍
Wi-Fi探针技术是指基于Wi-Fi探测技术来识别无线访问接入点附近已开启Wi-Fi的智能手机或者其他Wi-Fi终端的技术,无需用户接入Wi-Fi,Wi-Fi探针就能够识别用户的信息。Wi-Fi探针采集到的数据主要为Mac层的信息,比如设备Mac地址、Wi-Fi信号强度、Wi-Fi信号频道、信号帧类型等。Wi-Fi探针常被应用于客流统计领域,根据Wi-Fi终端距离Wi-Fi探针越近,探测到的信号强度越强的原理,现有技术中在区域内部署一个Wi-Fi探针,通过人为设定一个信号强度阈值,直接比较探测到的信号强度与阈值的大小来判定顾客是否进店,即当探测到的信号强度大于阈值的时候判定进店,反之判定未进店。但在实际操作中,随着探针和Wi-Fi终端之间距离的增加,探测到的信号强度减小的趋势是不稳定的,另外信号强度还与中间是否存在遮挡物等因素有关,导致单个Wi-Fi探针采集到的单条信号强度有较大的随机性,使用这种未经处理的探测到的信号强度与根据经验人为确定出的阈值来判定是否进店,判定结果也会存在较大的误差。此外,单个Wi-Fi探针的探测范围有限,在目标场所较大时,可能并不能将其全面覆盖,同样会对判定结果造成较大的误差。针对相关技术中使用单个Wi-Fi探针探测到的未经处理的Wi-Fi信号数据和经验阈值判断特定群体进入目标场所的判定结果存在较大误差的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请的主要目的在于提供一种用于识别目标群体的数据处理方法 ...
【技术保护点】
1.一种用于识别目标群体的数据处理方法,其特征在于,通过在预设区域内部署多个Wi‑Fi探针用于识别所述预设区域内的待检测设备,通过所述待检测设备用于获得探测数据,所述方法包括:接收所述探测数据;按照预设的数据格式将所述探测数据整理为特征识别数据;以及将所述特征识别数据作为训练特征,训练得到目标群体的识别模型,其中,所述目标群体用于作为进入预设区域内的目标场所的群体。
【技术特征摘要】
1.一种用于识别目标群体的数据处理方法,其特征在于,通过在预设区域内部署多个Wi-Fi探针用于识别所述预设区域内的待检测设备,通过所述待检测设备用于获得探测数据,所述方法包括:接收所述探测数据;按照预设的数据格式将所述探测数据整理为特征识别数据;以及将所述特征识别数据作为训练特征,训练得到目标群体的识别模型,其中,所述目标群体用于作为进入预设区域内的目标场所的群体。2.根据权利要求1所述的用于识别目标群体的数据处理方法,其特征在于,所述按照预设的数据格式将所述探测数据整理为特征识别数据包括:确定所述预设区域内部署Wi-Fi探针的探针Mac信息;获取所述待检测设备上的设备Mac信息,信号强度和探测时间戳;确定设定周期,并将所述设定周期的起始时间作为聚合时间戳;统计所述设定周期内探针探测到的设备Mac信息的次数,并计算出被探测到的信号强度的平均信号强度,同时确定其中的最大信号强度和最小信号强度。3.根据权利要求2所述的用于识别目标群体的数据处理方法,其特征在于,按照如下预设的数据格式整理得到所述特征识别数据:{探针Mac,设备Mac,探测次数,平均信号强度,最大信号强度,最小信号强度,聚合时间戳}。4.根据权利要求1所述的用于识别目标群体的数据处理方法,其特征在于,所述将所述特征识别数据作为训练特征,训练得到目标群体的识别模型包括:根据预设分类条件选取正样本和负样本;利用所述正样本和负样本的的特征识别数据训练分类模型;将所述分类模型作为目标群体的识别模型。5.根据权利要求4所述的用于识别目标群体的数据处理方法,其特征在于,所述根据预设分类条件选取正样本和负样本包括:将一天内被探测到的时长大于8小时,且一周内被探测到的天数不小于两天的样本定义为正样本;将一天内被探测到的时长小于3小时,且一周内被探测到的天数为一天的样本...
【专利技术属性】
技术研发人员:张为,朱智,
申请(专利权)人:南京芝麻信息科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。