用户家庭和工作地址的确定方法和系统技术方案

技术编号:19903514 阅读:55 留言:0更新日期:2018-12-26 02:56
本申请涉及一种用户家庭和工作地址的确定方法和系统,所述方法包括:获取所有用户地理位置信息;对所述用户地理位置信息进行预处理,得到预处理后的行程数据;利用DBSCAN算法对所述预处理后的行程数据进行聚类,得到多个备选集群;利用KMeans算法计算各个所述备选集群的中心点,确定所述中心点为集群中心;提取所述备选集群的特征;根据所述特征,确定家庭地址集群和工作地址集群;确定所述家庭地址集群的集群中心的地址为家庭地址;确定所述工作地址集群的集群中心为工作地址。本申请能够准确获得用户的家庭地址和工作地址。

【技术实现步骤摘要】
用户家庭和工作地址的确定方法和系统
本申请属于地址挖掘
,特别涉及一种用户家庭和工作地址的确定方法和系统。
技术介绍
家庭和工作地址是用户在日常生活中的主要活动地点,智能手机和信息技术的不断发展与普及为人们的日常生活带来了极大的便利。除了通话、上网等传统应用之外,相关手机应用及LOT设备等采集数据也是用于用户行为模式挖掘的重要数据来源,例如家庭和工作地址。然而,相关工作面临着诸多挑战,包括轨迹数据漂移、位置精度高低不一以及行程的起始终止点不精确。因此,亟需一种能够准确获得用户家庭和工作地址的技术方案。
技术实现思路
为至少在一定程度上克服相关技术中存在的问题,本申请提供一种用户家庭和工作地址的确定方法和系统。根据本申请实施例的第一方面,提供一种用户家庭和工作地址的确定方法,包括:获取所有用户地理位置信息;对所述用户地理位置信息进行预处理,得到预处理后的行程数据;利用DBSCAN算法对所述预处理后的行程数据进行聚类,得到多个备选集群;利用KMeans算法计算各个所述备选集群的中心点,确定所述中心点为集群中心提取所述备选集群的特征;根据所述特征,确定家庭地址集群和工作地址集群;确定所述本文档来自技高网...

【技术保护点】
1.一种用户家庭和工作地址的确定方法,其特征在于,包括:获取所有用户地理位置信息;对所述用户地理位置信息进行预处理,得到预处理后的行程数据;利用DBSCAN算法对所述预处理后的行程数据进行聚类,得到多个备选集群;利用KMeans算法计算各个所述备选集群的中心点,确定所述中心点为集群中心;提取所述备选集群的特征;根据所述特征,确定家庭地址集群和工作地址集群;确定所述家庭地址集群的集群中心的地址为家庭地址;确定所述工作地址集群的集群中心为工作地址。

【技术特征摘要】
1.一种用户家庭和工作地址的确定方法,其特征在于,包括:获取所有用户地理位置信息;对所述用户地理位置信息进行预处理,得到预处理后的行程数据;利用DBSCAN算法对所述预处理后的行程数据进行聚类,得到多个备选集群;利用KMeans算法计算各个所述备选集群的中心点,确定所述中心点为集群中心;提取所述备选集群的特征;根据所述特征,确定家庭地址集群和工作地址集群;确定所述家庭地址集群的集群中心的地址为家庭地址;确定所述工作地址集群的集群中心为工作地址。2.根据权利要求1所述的用户家庭和工作地址的确定方法,其特征在于,所述对所述用户地理位置信息进行预处理,得到预处理后的行程数据,具体包括:将所述用户地理位置信息以用户身份进行分组,得到单用户地理位置信息;将所述单用户地理位置信息按时间进行排序,得到有序行程数据;按预设时间段提取所述有序行程数据,得到预处理后的行程数据。3.根据权利要求1所述的用户家庭和工作地址的确定方法,其特征在于,所述利用DBSCAN算法对所述预处理后的行程数据进行聚类,得到多个备选集群,具体包括:获取设定的超参数组合;根据所述超参数组合利用DBSCAN算法对所述预处理后的行程数据进行调优计算,得到各个用户的最优地理位置集群;按集群点数由多到少对所述最优地理位置集群进行排序,确定排序为前n个集群为备选集群。4.根据权利要求3所述的用户家庭和工作地址的确定方法,其特征在于,所述根据所述特征,确定家庭地址集群和工作地址集群,具体包括:遍历用户经过时间排序后的所有行程点,从第二段行程的开始,判断当前行程起点的位置与上一段行程的终止位置距离是否小于第一阈值,得到第一判断结果;当所述第一判断结果为否时,继续判断当下一段行程起点的位置与当前段行程的终止位置距离是否小于第一阈值,得到第一判断结果;当所述第一判断结果为是时,计算该段行程起点的位置距离所有所述备选集群的集群中心的距离,判断是否存在所述距离小于第二阈值的所述集群中心,得到第二判断结果;当所述第二判断结果表示是时,将该段行程加入所述集群中心所属的所述备选集群;当所述第二判断结果表示否时,返回“继续判断当下一段行程起点的位置与当前段行程的终止位置距离是否小于第一阈值,得到第一判断结果”的步骤;遍历某用户经过时间排序后的所有行程点,从第二段行程开始,判断该行程起点与上段行程的终点时间间隔,然后加入该行程对应备选集群的总时间间隔TC;判断该段行程时间内是否有周六周日的时间,将相关时间加入到周...

【专利技术属性】
技术研发人员:鲍明广
申请(专利权)人:上海中通吉网络技术有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1