用于识别目标群体的数据处理方法及装置制造方法及图纸

技术编号:18668607 阅读:23 留言:0更新日期:2018-08-14 20:44
本申请公开了一种用于识别目标群体的数据处理方法,通过在预设区域内部署多个Wi‑Fi探针用于识别所述预设区域内的待检测设备,通过所述待检测设备用于获得探测数据,该方法包括:接收所述探测数据;按照预设的数据格式将所述探测数据整理为特征识别数据;以及将所述特征识别数据作为训练特征,训练得到目标群体的识别模型,其中,所述目标群体用于作为进入预设区域内的目标场所的群体。本申请解决了现有技术中使用单个Wi‑Fi探针探测到的未经处理的Wi‑Fi信号数据和经验阈值判断特定群体进入目标场所的判定结果存在较大误差的技术问题。

Data processing method and device for identifying target group

The present application discloses a data processing method for identifying a target group by deploying a plurality of Wi_Fi probes within a preset area for identifying a device to be detected in the preset area and for obtaining detection data through the device to be detected. The method includes: receiving the detection data; and according to the preset data grid. The detection data are sorted into feature recognition data, and the feature recognition data are used as training features to train a recognition model of the target group, wherein the target group is used as a group of target sites entering a preset area. The application solves a technical problem in the prior art that there is a large error in judging the result of a particular group entering a target site by using unprocessed Wi_Fi signal data detected by a single Wi_Fi probe and empirical thresholds.

【技术实现步骤摘要】
用于识别目标群体的数据处理方法及装置
本申请涉及通信领域,具体而言,涉及一种用于识别目标群体的数据处理方法及装置。
技术介绍
Wi-Fi探针技术是指基于Wi-Fi探测技术来识别无线访问接入点附近已开启Wi-Fi的智能手机或者其他Wi-Fi终端的技术,无需用户接入Wi-Fi,Wi-Fi探针就能够识别用户的信息。Wi-Fi探针采集到的数据主要为Mac层的信息,比如设备Mac地址、Wi-Fi信号强度、Wi-Fi信号频道、信号帧类型等。Wi-Fi探针常被应用于客流统计领域,根据Wi-Fi终端距离Wi-Fi探针越近,探测到的信号强度越强的原理,现有技术中在区域内部署一个Wi-Fi探针,通过人为设定一个信号强度阈值,直接比较探测到的信号强度与阈值的大小来判定顾客是否进店,即当探测到的信号强度大于阈值的时候判定进店,反之判定未进店。但在实际操作中,随着探针和Wi-Fi终端之间距离的增加,探测到的信号强度减小的趋势是不稳定的,另外信号强度还与中间是否存在遮挡物等因素有关,导致单个Wi-Fi探针采集到的单条信号强度有较大的随机性,使用这种未经处理的探测到的信号强度与根据经验人为确定出的阈值来判定是否进店,判定结果也会存在较大的误差。此外,单个Wi-Fi探针的探测范围有限,在目标场所较大时,可能并不能将其全面覆盖,同样会对判定结果造成较大的误差。针对相关技术中使用单个Wi-Fi探针探测到的未经处理的Wi-Fi信号数据和经验阈值判断特定群体进入目标场所的判定结果存在较大误差的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请的主要目的在于提供一种用于识别目标群体的数据处理方法,以解决现有技术中使用单个Wi-Fi探针探测到的未经处理的Wi-Fi信号数据和经验阈值判断特定群体进入目标场所的判定结果存在较大误差的问题。为了实现上述目的,根据本申请的一个方面,提供了一种用于识别目标群体的数据处理方法,通过在预设区域内部署多个Wi-Fi探针用于识别所述预设区域内的待检测设备,通过所述待检测设备用于获得探测数据,所述方法包括:接收所述探测数据;按照预设的数据格式将所述探测数据整理为特征识别数据;以及将所述特征识别数据作为训练特征,训练得到目标群体的识别模型,其中,所述目标群体用于作为进入预设区域内的目标场所的群体。进一步地,所述按照预设的数据格式将所述探测数据整理为特征识别数据包括:确定所述预设区域内部署Wi-Fi探针的探针Mac信息;获取所述待检测设备上的设备Mac信息,信号强度和探测时间戳;确定设定周期,并将所述设定周期的起始时间作为聚合时间戳;统计所述设定周期内探针探测到的设备Mac信息的次数,并计算出被探测到的信号强度的平均信号强度,同时确定其中的最大信号强度和最小信号强度。进一步地,按照如下预设的数据格式整理得到所述特征识别数据:{探针Mac,设备Mac,探测次数,平均信号强度,最大信号强度,最小信号强度,聚合时间戳}。进一步地,所述将所述特征识别数据作为训练特征,训练得到目标群体的识别模型包括:根据预设分类条件选取正样本和负样本;利用所述正样本和负样本的的特征识别数据训练分类模型;以及将所述分类模型作为目标群体的识别模型。进一步地,所述根据预设分类条件选取正样本和负样本包括:将一天内被探测到的时长大于8小时,且一周内被探测到的天数不小于两天的样本定义为正样本;将一天内被探测到的时长小于3小时,且一周内被探测到的天数为一天的样本定义为负样本。进一步地,在将所述特征识别数据作为训练特征,训练得到目标群体的识别模型之后还包括:采集所述未知群体的探测数据;按照所述预设的数据格式将所述未知群体的探测数据整理为特征识别数据;将所述未知群体的特征识别数据输入所述目标群体的识别模型;以及根据所述识别模型得出的识别结果判定未知群体是否属于目标群体。为了实现上述目的,根据本申请的一个方面,提供了一种用于识别目标群体的数据处理装置,该装置包括:数据采集模块,用于接收所述探测数据;数据处理模块,用于按照预设的数据格式将所述探测数据整理为特征识别数据;以及训练模块,用于将所述特征识别数据作为训练特征,训练得到目标群体的识别模型,所述目标群体为进入预设区域内的目标场所的群体。进一步地,所述数据处理模块包括:提取模块,用于提取所述探测数据中的特征数据;以及整理模块,用于将所述探测数据中的特征数据按照预设的数据格式整理为所述特征识别数据。进一步地,所述数据处理装置还包括:识别模块,用于利用所述目标群体的识别模型对未知群体进行识别,所述识别模块包括:预处理模块,用于采集所述未知群体的探测数据并按照所述预设的数据格式将所述未知群体的探测数据整理为特征识别数据;以及判定模块,用于将所述未知群体的特征识别数据输入所述目标群体的识别模型并根据所述识别模型得出的识别结果判定未知群体是否属于目标群体。进一步地,所述数据处理装置还包括:可视化模块,用于将识别目标群体的数据处理结果显示在web端,所述可视化模块包括:统计模块,用于统计预设时段内所述目标群体的数量;以及显示模块,用于将所述统计结果显示在web端。在本申请实施例中,采用在预设区域内部署多个Wi-Fi探针的方式,通过多个Wi-Fi探针获取预设区域内的待检测设备的探测数据,能够多方位全面覆盖目标场所,对探测数据进行整理后用于训练得到目标群体的识别模型,达到了了客观、准确、稳定地识别进入预设区域内的目标场所的目标群体的目的,进而解决了现有技术中使用单个Wi-Fi探针探测到的未经处理的Wi-Fi信号数据和经验阈值判断特定群体进入目标场所的判定结果存在较大误差的问题。附图说明构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是根据本申请第一实施例的用于识别目标群体的数据处理方法的流程示意图;图2是根据本专利技术第二实施例的用于识别目标群体的数据处理方法的流程示意图;图3是根据本专利技术第三实施例的用于识别目标群体的数据处理方法的流程示意图;图4是根据本专利技术第四实施例的用于识别目标群体的数据处理方法的流程示意图;图5是根据本专利技术第一实施例的用于识别目标群体的数据处理装置的示意图;图6是根据本专利技术第二实施例的用于识别目标群体的数据处理装置的示意图;图7是根据本专利技术第三实施例的用于识别目标群体的数据处理装置的示意图;以及图8是根据本专利技术第四实施例的用于识别目标群体的数据处理装置的示意图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。本申请的说明书和权利要求书中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。需要说明的是本文档来自技高网
...

【技术保护点】
1.一种用于识别目标群体的数据处理方法,其特征在于,通过在预设区域内部署多个Wi‑Fi探针用于识别所述预设区域内的待检测设备,通过所述待检测设备用于获得探测数据,所述方法包括:接收所述探测数据;按照预设的数据格式将所述探测数据整理为特征识别数据;以及将所述特征识别数据作为训练特征,训练得到目标群体的识别模型,其中,所述目标群体用于作为进入预设区域内的目标场所的群体。

【技术特征摘要】
1.一种用于识别目标群体的数据处理方法,其特征在于,通过在预设区域内部署多个Wi-Fi探针用于识别所述预设区域内的待检测设备,通过所述待检测设备用于获得探测数据,所述方法包括:接收所述探测数据;按照预设的数据格式将所述探测数据整理为特征识别数据;以及将所述特征识别数据作为训练特征,训练得到目标群体的识别模型,其中,所述目标群体用于作为进入预设区域内的目标场所的群体。2.根据权利要求1所述的用于识别目标群体的数据处理方法,其特征在于,所述按照预设的数据格式将所述探测数据整理为特征识别数据包括:确定所述预设区域内部署Wi-Fi探针的探针Mac信息;获取所述待检测设备上的设备Mac信息,信号强度和探测时间戳;确定设定周期,并将所述设定周期的起始时间作为聚合时间戳;统计所述设定周期内探针探测到的设备Mac信息的次数,并计算出被探测到的信号强度的平均信号强度,同时确定其中的最大信号强度和最小信号强度。3.根据权利要求2所述的用于识别目标群体的数据处理方法,其特征在于,按照如下预设的数据格式整理得到所述特征识别数据:{探针Mac,设备Mac,探测次数,平均信号强度,最大信号强度,最小信号强度,聚合时间戳}。4.根据权利要求1所述的用于识别目标群体的数据处理方法,其特征在于,所述将所述特征识别数据作为训练特征,训练得到目标群体的识别模型包括:根据预设分类条件选取正样本和负样本;利用所述正样本和负样本的的特征识别数据训练分类模型;将所述分类模型作为目标群体的识别模型。5.根据权利要求4所述的用于识别目标群体的数据处理方法,其特征在于,所述根据预设分类条件选取正样本和负样本包括:将一天内被探测到的时长大于8小时,且一周内被探测到的天数不小于两天的样本定义为正样本;将一天内被探测到的时长小于3小时,且一周内被探测到的天数为一天的样本...

【专利技术属性】
技术研发人员:张为朱智
申请(专利权)人:南京芝麻信息科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1