基于发送位置数据确定与Wi-Fi相匹配的POI的方法及装置制造方法及图纸

技术编号:23315152 阅读:64 留言:0更新日期:2020-02-11 17:49
本发明专利技术提供基于发送位置数据确定与Wi‑Fi相匹配的POI的方法及装置,该方法包括:接收不同终端上报的第一发送位置数据,从所述第一发送位置数据中提取共现关系对,共现关系对包括连接的Wi‑Fi和POI;对于所述共现关系对中的Wi‑Fi和POI,基于包含Wi‑Fi和/或POI的第一发送位置数据,得到相关统计信息;将相关统计信息映射为输入特征向量,输入到机器分类模型,得到该Wi‑Fi和POI的关联度;根据不同共现关系对中的Wi‑Fi和POI的关联度,确定与不同Wi‑Fi相匹配POI。本发明专利技术采用发送位置数据对机器分类模型训练,能够有效的补充无法通过名称相似度进行判定Wi‑Fi与POI是否相匹配的问题。

A method and device to determine the POI matching Wi Fi based on the data of sending position

【技术实现步骤摘要】
基于发送位置数据确定与Wi-Fi相匹配的POI的方法及装置
本专利技术涉及移动通信
,特别涉及基于发送位置数据确定与Wi-Fi相匹配的POI的方法及装置。
技术介绍
现代社会中,利用无线局域网Wi-Fi信号进行数据传输的频率越来越高,其中Wi-Fi设备分为移动Wi-Fi设备和固定Wi-Fi设备,固定的Wi-Fi设备多为商户、学校、居民区等POI(PointofInterest,兴趣点)实体的附属设备,其位置基本固定,也大部分和POI有对应关系;移动Wi-Fi设备多为移动终端或其他移动设备开设的热点,位置不固定,且和POI没有对应关系。在用户确认接受移动终端中的位置共享协议的情况下,经过对数据的去隐私化后,可以得到各用户在使用相关APP时获得的数据脱敏位置信息,所述数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。基于上述数据脱敏位置信息,可以在宏观层面上可以对各Wi-Fi设备上存在的连接行为进行统计,基于这类统计信息可以对Wi-Fi进行分析和分类,通过Wi-Fi的类别(例如家庭Wi-Fi,服务型商区Wi-Fi,公司Wi-Fi等),可以对用户行为进行分析,实现对不同业务场景下的用户群进行发掘。用户发送位置时选择的POI和当时连接的Wi-Fi记为一次共现关系,根据用户的共现关系数据,筛选出POI和当时连接的Wi-Fi相匹配的共现关系数据,根据筛选出的共现关系数据中的POI分析用户行为。通过连接的Wi-Fi名称和选择的POI名称之间的语义相似度,是判断是否匹配最为普遍的方法。此方法根据WI-Fi的位置找到周边一定范围内的POI,计算Wi-Fi名称与这些POI名称的相似值,找到相似度最大的且大于一定阈值的POI作为匹配结果。现有的Wi-Fi、POI匹配方法只适用于Wi-Fi命名比较规范、与POI名称相关的场景,当Wi-Fi名称杂乱无章、与POI名称没有明显关系时无法通过此方法进行关联。
技术实现思路
本专利技术提供了基于发送位置数据确定与Wi-Fi相匹配的POI的方法及装置,用于解决现有名称匹配方法只适用于Wi-Fi命名比较规范、与POI名称相关的场景,通过提取微信发送位置数据中连接Wi-Fi和POI的共现关系的统计信息作为特征,经过模型训练,可以有效的关联名称上没有明确关系的Wi-Fi和POI。本专利技术的第一方面提供基于发送位置数据确定与Wi-Fi相匹配的POI的方法,包括:接收不同终端上报的第一发送位置数据,从所述第一发送位置数据中提取共现关系对,所述共现关系对包括终端连接的Wi-Fi和选择的POI;对于所述共现关系对中的Wi-Fi和POI,基于包含该Wi-Fi和/或该POI的第一发送位置数据,得到该Wi-Fi和/或POI的相关统计信息;将所述相关统计信息映射为输入特征向量,输入到机器分类模型,得到该共现关系对中该Wi-Fi和POI的关联度;根据不同共现关系对中的Wi-Fi和POI的关联度,确定与不同Wi-Fi相匹配POI。本专利技术的第二方面提供基于发送位置数据确定与Wi-Fi相匹配的POI的装置,该装置包括以下几个模块:终端发送位置数据提取模块,用于接收不同终端上报的第一发送位置数据,从所述第一发送位置数据中提取共现关系对,所述共现关系对包括终端连接的Wi-Fi和选择的POI;相关统计信息获取模块,用于对于所述共现关系对中的Wi-Fi和POI,基于包含该Wi-Fi和/或该POI的第一发送位置数据,得到该Wi-Fi和/或POI的相关统计信息;关联度确定模块,用于将所述相关统计信息映射为输入特征向量,输入到机器分类模型,得到该共现关系对中该Wi-Fi和POI的关联度;匹配确定模块,用于根据不同共现关系对中的Wi-Fi和POI的关联度,确定与不同Wi-Fi相匹配POI。可选地,匹配确定模块确定与不同Wi-Fi相匹配POI,包括:根据不同共现关系对中的Wi-Fi和POI的关联度,对于不同Wi-Fi,确定与该Wi-Fi共现的不同POI中,关联度最大值对应的POI;若所述关联度最大值高于设定阈值,确定该Wi-Fi与所述关联度最大值对应的POI相匹配,否则确定该Wi-Fi不存在相匹配的POI。可选地,所述机器分类模型为利用历史时间段内的第二发送位置数据得到的训练样本进行训练得到的分类模型,所述训练样本包括Wi-Fi和POI相匹配的共现关系对,及Wi-Fi和POI不相匹配的共现关系对。可选地,关联度确定模块利用训练样本训练得到分类模型,包括:对于训练样本的共现关系对,基于包含该共现关系对中Wi-Fi和/或POI的第二发送位置数据,得到该训练样本中Wi-Fi和/或POI的相关统计信息;将所述相关统计信息映射为输入特征向量,将该训练样本中Wi-Fi和POI的匹配/不匹配对应的关联度作为输出特征,对机器分类模型进行训练。可选地,将所述相关统计信息映射为输入特征向量,包括如下至少一个步骤,包括如下至少一种:基于同时包含所述Wi-Fi和POI的第一发送位置数据/第二发送位置数据,得到与共现行为相关统计信息,将所述共现行为相关统计信息映射为第一输入特征向量;基于包含所述Wi-Fi共现关系对的第一发送位置数据/第二发送位置数据,统计得到所述Wi-Fi相关统计信息,将与Wi-Fi相关统计信息映射为第二输入特征向量;基于包含所述POI共现关系对的第一发送位置数据/第二发送位置数据,得到与所述POI相关统计信息,将与所述POI相关统计信息映射为第三输入特征向量。可选地,将所述共现行为相关统计信息映射为第一输入特征向量,包括如下至少一个步骤:将连接所述Wi-Fi并选择所述POI的共现总次数映射为第一输入特征向量;将连接所述Wi-Fi并选择所述POI的共现总终端数映射为第一输入特征向量;将连接所述Wi-Fi并选择所述POI的共现总天数映射为第一输入特征向量;将连接所述Wi-Fi并选择所述POI的不同终端中,所统计的终端所在位置与所述POI的平均距离映射为第一输入特征向量。可选地,将与Wi-Fi相关统计信息映射为第二输入特征向量包括如下至少一个步骤:将连接所述Wi-Fi并选择任一POI的共现总次数映射为第二输入特征向量;将连接所述Wi-Fi并选择任一POI的共现关系中,不同POI的总数量映射为第二输入特征向量;将连接所述Wi-Fi并选择任一POI的共现总次数中,连接所述Wi-Fi并选择所述POI的共现总次数所占的比例映射为第二输入特征向量。可选地,将与所述POI相关统计信息映射为第三输入特征向量包括如下至少一个步骤:将连接任一Wi-Fi并选择所述POI的共现总次数映射为第三输入特征向量;将连接任一Wi-Fi并选择所述POI的共现关系中,不同Wi-Fi的总数量映射为第三输入特征向量;将连接任一Wi-Fi并选择所述POI的共现总次数中,连接所述Wi-F本文档来自技高网
...

【技术保护点】
1.基于发送位置数据确定与Wi-Fi相匹配的POI的方法,其特征在于,包括:/n接收不同终端上报的第一发送位置数据,从所述第一发送位置数据中提取共现关系对,所述共现关系对包括终端连接的Wi-Fi和选择的POI;/n对于所述共现关系对中的Wi-Fi和POI,基于包含该Wi-Fi和/或该POI的第一发送位置数据,得到该Wi-Fi和/或POI的相关统计信息;/n将所述相关统计信息映射为输入特征向量,输入到机器分类模型,得到该共现关系对中该Wi-Fi和POI的关联度;/n根据不同共现关系对中的Wi-Fi和POI的关联度,确定与不同Wi-Fi相匹配POI。/n

【技术特征摘要】
1.基于发送位置数据确定与Wi-Fi相匹配的POI的方法,其特征在于,包括:
接收不同终端上报的第一发送位置数据,从所述第一发送位置数据中提取共现关系对,所述共现关系对包括终端连接的Wi-Fi和选择的POI;
对于所述共现关系对中的Wi-Fi和POI,基于包含该Wi-Fi和/或该POI的第一发送位置数据,得到该Wi-Fi和/或POI的相关统计信息;
将所述相关统计信息映射为输入特征向量,输入到机器分类模型,得到该共现关系对中该Wi-Fi和POI的关联度;
根据不同共现关系对中的Wi-Fi和POI的关联度,确定与不同Wi-Fi相匹配POI。


2.根据权利要求1所述的方法,其特征在于,确定与不同Wi-Fi相匹配POI,包括:
根据不同共现关系对中的Wi-Fi和POI的关联度,对于任一Wi-Fi,确定与该Wi-Fi共现的不同POI中,关联度最大值对应的POI;
若所述关联度最大值高于设定阈值,确定该Wi-Fi与所述关联度最大值对应的POI相匹配,否则确定该Wi-Fi不存在相匹配的POI。


3.根据权利要求1所述的方法,其特征在于,所述机器分类模型为利用历史时间段内的第二发送位置数据得到的训练样本进行训练得到的分类模型,所述训练样本包括Wi-Fi和POI相匹配的共现关系对,及Wi-Fi和POI不相匹配的共现关系对。


4.根据权利要求3所述的方法,其特征在于,利用训练样本训练得到分类模型,包括:
对于训练样本的共现关系对,基于包含该共现关系对中Wi-Fi和/或POI的第二发送位置数据,得到该训练样本中Wi-Fi和/或POI的相关统计信息;
将所述相关统计信息映射为输入特征向量,将该训练样本中Wi-Fi和POI的匹配/不匹配对应的关联度作为输出特征,对机器分类模型进行训练。


5.根据权利要求1~4任一所述的方法,其特征在于,将所述相关统计信息映射为输入特征向量,包括如下至少一个步骤:
基于同时包含所述Wi-Fi和POI的第一发送位置数据/第二发送位置数据,得到与共现行为相关统计信息,将所述共现行为相关统计信息映射为第一输入特征向量;
基于包含所述Wi-Fi共现关系对的第一发送位置数据/第二发送位置数据,得到与所述Wi-Fi相关统计信息,将与Wi-Fi相关统计信息映射为第二输入特征向量;
基于包含所述POI共现关系对的第一发送位置数据/第二发送位置数据,得到与所述POI相关统计信息,将与所述POI相关统计信息映射为第三输入特征向量。


6.根据权利要求5所述的方法,其特征在于,将所述共现行为相关统计信息映射为第一输入特征向量,包括如下至少一个步骤:
将连接所述Wi-Fi并选择所述POI的共现总次数映射为第一输入特征向量;
将连接所述Wi-Fi并选择所述POI的共现总终端数映射为第一输入特征向量;
将连接所述Wi-Fi并选择所述POI的共现总天数映射为第一输入特征向量;
将连接所述Wi-Fi并选择所述POI的不同终端中,所统计的终端所在位置与所述POI的平均距离映射为第一输入特征向量。


7.根据权利要求5所述的方法,其特征在于,将与Wi-Fi相关统计信息映射为第二输入特征向量,包括如下至...

【专利技术属性】
技术研发人员:曹睿张升孙福宁
申请(专利权)人:腾讯大地通途北京科技有限公司腾讯科技深圳有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1