访客终端的识别方法、装置、设备及存储介质制造方法及图纸

技术编号:24419593 阅读:36 留言:0更新日期:2020-06-06 13:20
本申请公开了一种访客终端的识别方法、装置、设备及存储介质,应用于人工智能中的机器学习领域。该方法包括:通过无线网探针设备获取无线终端的扫描数据集;调用分类模型对无线终端的扫描数据集进行特征提取和特征识别,得到无线终端的识别结果,分类模型是对正样本和未知样本进行半监督学习得到的,正样本包括连接到无线网探针设备的无线终端对应的扫描数据集,未知样本包括未连接到无线网探针设备的无线终端对应的扫描数据集,识别结果包括访客终端或非访客终端;输出无线终端的识别结果。该方法利用将未连接到无线网探针设备的无线终端的扫描数据集作为未知样本进行半监督学习得到的分类模型,对无线终端进行判断,提高判断准确度。

Identification method, device, equipment and storage medium of visitor terminal

【技术实现步骤摘要】
访客终端的识别方法、装置、设备及存储介质
本申请涉及人工智能中的机器学习领域,特别涉及一种访客终端的识别方法、装置、设备及存储介质。
技术介绍
现如今,线下商户会在线上发布活动来吸引用户到店消费。为了确定线上活动的效果,商户需要统计用户的到店情况。相关技术中,商户通过设置在店内的WiFi(Wireless-Fidelity,无线网)探针获取用户的随身携带的移动终端的信息,来确定用户的到店情况。WiFi探针技术是基于WiFi探测技术来识别无线AP(AccessPoint,接入点)附近已开启WiFi的终端设备。WiFi探针可以获取到终端设备的信息,包括终端设备的MAC(MediaAccessControlAddress,媒体存取控制地址)、WiFi信号强度、WiFi信号频道、信号帧类型、时间戳等。相关技术中,将连接到WiFi探针的终端对应的信息确定为正样本,将未连接到WiFi探针的终端对应的信息确定为负样本,训练得到分类模型,根据分类模型和终端的信息来判断终端是否是访客终端,并以此确定用户的到店情况。相关技术中访客终端的识别方法,将未连接到WiFi探针的终端对应的信息确定为负样本是不合理的,未连接到WiFi探针的终端也可能是到店客人使用的终端,只不过客人不需要使用店内的无线网,用这样的负样本训练得到的分类模型显然不能准确判断访客终端。
技术实现思路
本申请实施例提供了一种访客终端的识别方法、装置、设备及存储介质,可以准确判断访客终端。所述技术方案如下:根据本申请的一个方面,提供了一种访客终端的识别方法,所述方法包括:通过无线网探针设备获取无线终端的扫描数据集;调用分类模型对所述无线终端的所述扫描数据集进行特征提取和特征识别,得到所述无线终端的识别结果,所述分类模型是对正样本和未知样本进行半监督学习得到的,所述正样本包括连接到所述无线网探针设备的所述无线终端对应的所述扫描数据集,所述未知样本包括未连接到所述无线网探针设备的所述无线终端对应的所述扫描数据集,所述识别结果包括访客终端或非访客终端;输出所述无线终端的所述识别结果。根据本申请的另一方面,提供了一种访客终端的识别装置,所述装置包括:数据采集模块,用于通过无线网探针设备获取线终端的扫描数据集;分类模型模块,用于调用分类模型对所述无线终端的所述扫描数据集进行特征提取和特征识别,得到所述无线终端的识别结果,所述分类模型是对正样本和未知样本进行半监督学习得到的,所述正样本包括连接到所述无线网探针设备的所述无线终端对应的所述扫描数据集,所述未知样本包括未连接到所述无线网探针设备的所述无线终端对应的所述扫描数据集,所述识别结果包括访客终端或非访客终端;输出模块,用于输出所述无线终端的所述识别结果。根据本申请的另一方面,提供了一种计算机设备,所述计算机设备包括:处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上方面所述的访客终端的识别方法。根据本申请的另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上方面所述的访客终端的识别方法。本申请实施例提供的技术方案带来的有益效果至少包括:通过无线网探针设备获取无线终端的扫描数据集,利用分类模型对扫描数据集进行特征提取和识别,从而得到对无线终端的识别结果。其中,分类模型是利用正样本和未知样本进行半监督学习得到的,正样本是主动连接到无线网探针设备的无线终端对应的扫描数据集,未知样本是没有主动连接到无线网探针设备的无线终端对应的扫描数据集。利用半监督学习得到的分类模型,可以提高分类模型对未连接到无线网探针设备的无线终端属于访客终端或属于非访客终端的分辨能力,提高分类模型对未连接到无线网络探针设备的无线终端的识别准确度。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1是本申请一个示例性实施例提供的计算机系统的框图;图2是本申请一个示例性实施例提供的访客终端的识别方法的流程图;图3是本申请一个示例性实施例提供的特征示意图;图4是本申请另一个示例性实施例提供的客流营销系统的界面示意图;图5是本申请另一个示例性实施例提供的分类模型的训练方法的流程图;图6是本申请另一个示例性实施例提供的分类模型的训练方法的流程图;图7是本申请另一个示例性实施例提供的分类模型的训练方法的流程图;图8是本申请另一个示例性实施例提供的分类模型的训练方法的流程图;图9是本申请另一个示例性实施例提供的分类模型的训练方法的流程图;图10是本申请另一个示例性实施例提供的分类模型的训练方法的流程图;图11是本申请另一个示例性实施例提供的访客终端的识别方法的流程图;图12是本申请另一个示例性实施例提供的访客终端的识别方法的流程图;图13是本申请另一个示例性实施例提供的访客终端的识别方法的流程图;图14是本申请另一个示例性实施例提供的访客终端的识别装置的示意图;图15是本申请另一个示例性实施例提供的分类模型的训练装置的示意图;图16是本申请另一个示例性实施例提供的服务器的框图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。WiFi探针技术是基于WiFi探测技术来识别无线AP附近已开启WiFi的终端设备。WiFi探针可以获取到终端设备的信息,包括终端设备的MAC地址、WiFi信号强度、WiFi信号频道、信号帧类型、时间戳等。半监督学习是监督学习与无监督学习相结合的一种机器学习方法。半监督学习使用已标记数据和未标记数据来进行模式识别工作。示例性的,半监督学习利用已知样本和未知样本的聚类特性得到已知样本的分类方式,从而获得分类模型。其中,PU-learning算法是半监督学习的一个重要分支。PU-learning算法的基本思想分为两步,一是从未标记样本中找到可靠的负样本,一是用确定的正样本和可靠的负样本训练分类模型。其中,确定可靠的负样本的方法包括朴素贝叶斯算法、Spy算法、1-DNF算法等,以Spy算法为例,Spy算法从正样本P中抽取一部分样本S,正样本P去掉部分样本S后即为样本集PS,将部分样本S加入未知样本U中得到样本集US,利用样本集PS和样本集US训练得到分类模型g,用分类模型g对部分样本S预测得到的分类概率确定分类阈值,对未知样本U使用分类模型g得到每个样本的分类概率,当样本的分本文档来自技高网...

【技术保护点】
1.一种访客终端的识别方法,其特征在于,所述方法包括:/n通过无线网探针设备获取无线终端的扫描数据集;/n调用分类模型对所述无线终端的所述扫描数据集进行特征提取和特征识别,得到所述无线终端的识别结果,所述分类模型是对正样本和未知样本进行半监督学习得到的,所述正样本包括连接到所述无线网探针设备的所述无线终端对应的所述扫描数据集,所述未知样本包括未连接到所述无线网探针设备的所述无线终端对应的所述扫描数据集,所述识别结果包括访客终端或非访客终端;/n输出所述无线终端的所述识别结果。/n

【技术特征摘要】
1.一种访客终端的识别方法,其特征在于,所述方法包括:
通过无线网探针设备获取无线终端的扫描数据集;
调用分类模型对所述无线终端的所述扫描数据集进行特征提取和特征识别,得到所述无线终端的识别结果,所述分类模型是对正样本和未知样本进行半监督学习得到的,所述正样本包括连接到所述无线网探针设备的所述无线终端对应的所述扫描数据集,所述未知样本包括未连接到所述无线网探针设备的所述无线终端对应的所述扫描数据集,所述识别结果包括访客终端或非访客终端;
输出所述无线终端的所述识别结果。


2.根据权利要求1所述的方法,其特征在于,所述分类模型包括至少一个分类树;
所述得到所述无线终端的识别结果,包括:
响应于大于第一比例的所述分类树对所述无线终端的识别结果为所述访客终端,得到所述无线终端的识别结果为所述访客终端。


3.根据权利要求1所述的方法,其特征在于,所述分类模型包括至少一个分类树;
所述得到所述无线终端的识别结果,包括:
响应于大于第二比例的所述分类树对所述无线终端的识别结果为所述非访客终端,得到所述无线终端的识别结果为所述非访客终端。


4.根据权利要求1至3任一所述的方法,其特征在于,所述扫描数据集包括至少一条扫描数据,所述扫描数据包括:时间戳、连接状态、无线终端地址、探针地址、无线网地址、信号强度中的至少一个;
所述无线终端地址是所述无线终端的媒体存取控制MAC地址,所述MAC地址用于确认网络设备位置的位址;
所述探针地址是探针的MAC地址,所述探针地址用于向服务器发送所述扫描数据;
所述无线网地址是无线网的MAC地址,所述无线网地址用于为所述无线终端提供网络服务。


5.根据权利要求4所述的方法,其特征在于,所述扫描数据包括所述时间戳;所述得到所述无线终端的识别结果,包括:
响应于所述无线终端的扫描数据集中:所述时间戳早于或晚于营业时间的数量大于第一阈值,得到所述无线终端的所述识别结果为所述非访客终端,且所述非访客终端属于内部工作人员终端。


6.根据权利要求4所述的方法,其特征在于,所述扫描数据包括所述时间戳;所述得到所述无线终端的识别结果,包括:
响应于所述无线终端的扫描数据集中:所述时间戳包含的日期占工作日的比例大于第二阈值,得到所述无线终端的所述识别结果为所述非访客终端,且所述非访客终端属于内部工作人员终端。


7.根据权利要求4所述的方法,其特征在于,所述扫描数据包括所述无线终端地址;所述得到所述无线终端的识别结果,包括:
响应于所述无线终端的扫描数据集中:所述无线终端地址满足伪装MAC地址条件,得到所述无线终端的识别结果为所述非访客终端,且所述非访客终端属于无法识别的终端;
其中,所述伪地址条件是判断所述无线终端地址的组织位移标识符OUI是否为已知厂商的OUI的条件。


8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取样本无线终端的样本扫描数据集,所述样本扫描数据集包括所述样本无线终端的扫描数据集;
根据所述样本扫描数据集获取正样本和未知样本,所述正样本包括连接到所述无线网探针设备的所述样本无线终端的样本扫描数据集,所述未知样本包括未连接到所述无线网探针设备的所...

【专利技术属性】
技术研发人员:鲁梦平吴汉杰陈毅臻戴云峰师婷婷田帅
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1