一种基于历史定位信息的数据挖掘方法及装置制造方法及图纸

技术编号:15090561 阅读:41 留言:0更新日期:2017-04-07 19:09
本发明专利技术提供一种基于历史定位信息的数据挖掘方法及装置。方法包括:获取用户的历史定位信息;根据所述历史定位信息,确定所述用户的常去场所以及在所述常去场所的出现时间;根据用户的常去场所以及在所述常去场所的出现时间,确定该常去场所针对所述用户的语义信息。本发明专利技术的方案根据用户的历史定位信息确定出用户的常去场所以及在常去场所的时间,从而能够挖掘出常去场所针对用户的语义信息。由于确定出的语音信息对用户来讲具有针对性,因此可以用于对用户进行如广告、通知等信息推广的依据,从而使用户得到更好的体验。

Data mining method and device based on historical positioning information

The invention provides a method and a device for data mining based on historical positioning information. Methods include: historical position information acquisition of the user; according to the historical location information, determine the user often go to places and often go to places at the time; according to the users often go to places and appear in the time often go to places, to determine the semantic information to the user often go to places the. According to the user's historical positioning information, the scheme of the invention can determine the time to go to the user and the time to go to the place in order to be able to mine the semantic information of the user in the frequented place. Because the identified voice information is targeted to the user, it can be used to promote the user's information such as advertising, notification and other information, so that users get a better experience.

【技术实现步骤摘要】

本专利技术涉及数据挖掘领域,特别是一种基于历史定位信息的数据挖掘方法及装置
技术介绍
随着计算机技术、通信技术以及各种其他多媒体传输技术的发展,信息提供方式变得愈加多种多样。而针对用户的生活习惯,有目的地向用户推送信息是最有效、最合理的方法。通过用户的历史定位信息能够一定程度上了解用户的生活习惯,因此当前亟需一种基于用户历史定位信息进行数据挖掘的方案。
技术实现思路
本专利技术要解决的技术问题是提供一种基于历史定位信息的数据挖掘方法及装置,能够根据用户的历史定位信息挖掘出对信息推送具有参考价值的信息。为解决上述技术问题,本专利技术的实施例提供一种基于历史定位信息的数据挖掘方法,包括:获取用户的历史定位信息;根据所述历史定位信息,确定所述用户的常去场所以及在所述常去场所的出现时间;根据用户的常去场所以及在所述常去场所的出现时间,确定该常去场所针对所述用户的语义信息。其中,根据所述历史定位信息,确定所述用户的常去场所,包括:根据所述历史定位信息,确定用户在地图数据中,出现过的多个位置点;通过基于密度的聚类分析法,在所有位置点中,确定用户的常去区域;根据地图数据,确定用户的常去区域所对应的场所,并将该场所作为用户的常去场所;其中,通过基于密度的聚类分析法,在所述多个位置点中,确定用户的常去区域,包括:以位置点为中心,分别针对每个位置点,确定一第一预设范围的位置区域;将包含位置点最多、且位置点数量≥第一预设阈值的一个位置区域确定为用户的常去区域;保存常去区域内所有的位置点,并对距该常去区域的中心点预设距离之内的所有位置点进行过滤;基于过滤后剩余的位置点,重新确定用户另一个常去区域,直至用户的所有常去区域全部确认完毕。其中,根据所述历史定位信息,确定用户对应于常去场所的出现时间,包括:根据所述历史定位信息,确定用户出现在常去场所的多个位置点所对应的定位时间;将用户出现在常去场所的多个位置点对应的定位时间,作为用户在常去场所的出现时间。其中,根据用户的常去场所以及在所述常去场所的出现时间,确定该常去场所针对所述用户的语义信息,包括:根据用户在所述常去区域的每个出现时间,与预设的办公时间、休闲时间以及居家时间进行匹配,得到一匹配结果;若所述常去场所为工作场所,且所述匹配结果指示用户在办公时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户的公司;和/或若所述常去场所为居住场所,且所述匹配结果指示用户在居家时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户的住宅;和/或若所述常去场所为服务场所,且所述匹配结果指示用户在休闲时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户常去的服务地点。其中,若地图数据将所述常去场所细分为多个子区域,则所述方法还包括:根据所述地图数据,确定所述常去场所中每个子区域所包含的位置点;根据子区域中的位置点数量,确定所述常去区域中各个子区域的权重值;若某一子区域的权重值大于其他子区域,且其权重值占所有子区域的权重之和的比例大于第二预设阈值,则将该子区域作为用户在所述常去场所中的具体位置。其中,根据所述历史定位信息,确定用户在地图数据中,出现过的多个位置点,包括:将所述历史定位信息按照时间段进行分组;根据每一组历史定位信息,在地图数据中,确定各时间段内用户出现过的所有位置点;对同一时间段内用户出现过的所有位置点进行过滤,使得在同一时间段,一个第二预设范围的区域内,最多保留一个位置点。其中,对同一时间段内用户出现过的所有位置点进行过滤,使得在同一时间段,一个第二预设范围的区域内,最多保留一个位置点,包括:以位置点为中心,分别针对以同一时间段的每个位置点,确定一第二预设范围的检测区域;在包含位置点最多一个检测区域中,过滤掉除中心位置点以外的所有其它位置点;根据过滤后剩余的位置点,重新确定一个包含位置点最多的检测区域,并进行过滤,直至同一时间段内没有可再过滤的位置点。其中,根据所述历史定位信息,确定用户出现过的多个位置点,还包括:根据地图数据,确定并过滤掉坐落在道路、河流、湖泊以及海洋的位置点。此外,本专利技术的另一实施例还提供一种基于历史定位信息的数据挖掘装置,包括:获取模块,用于获取用户的历史定位信息;第一处理模块,用于根据所述历史定位信息,确定所述用户的常去场所以及在所述常去场所的出现时间;第二处理模块,用于根据用户的常去场所以及在所述常去场所的出现时间,确定该常去场所针对所述用户的语义信息。其中,所述第一处理模块,包括:投影子模块,用于根据所述历史定位信息,确定用户在地图数据中,出现过的多个位置点;聚类分子模块,用于根通过基于密度的聚类分析法,在所有位置点中,确定用户的常去区域;确定子模块,用于根据地图数据,确定用户的常去区域所对应的场所,并将该场所作为用户的常去场所;其中,所述聚类分子模块包括:位置区域确定单元,用于以位置点为中心,分别针对每个位置点,确定一第一预设范围的位置区域;常去区域确定单元,用于将包含位置点最多、且位置点数量≥第一预设阈值的一个位置区域确定为用户的常去区域;过滤单元,用于保存常去区域内所有的位置点,并对距该常去区域的中心点预设距离之内的所有位置点进行过滤;控制单元,用于控制所述常去区域确定单元以及过滤单元进行循环工作,直至用户的所有常去区域全部确认完毕。其中,所述第一处理模块,还包括:第一确定子模块,用于根据所述历史定位信息,确定用户出现在常去场所的多个位置点所对应的定位时间;第二确定子模块,用于将用户出现在常去场所的多个位置点对应的定位时间,作为用户在常去场所的出现时间。其中,所述第二处理模块包括:时间匹配子模块,用于根据用户在所述常去区域的每个出现时间,与预设的办公时间、休闲时间以及居家时间进行匹配,得到一匹配结果;第一挖掘子模块,用于若所述常去场所为工作场所,且所述匹配结果指示用户在办公时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户的公司;和/或第二挖掘子模块,用于若所述常去场所为居住场所,且所述匹配结果指示用户在居家时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户的住宅;和/或第三挖掘子模块,用于若所述常去场所为服务场所,且所述本文档来自技高网...

【技术保护点】
一种基于历史定位信息的数据挖掘方法,其特征在于,包括:获取用户的历史定位信息;根据所述历史定位信息,确定所述用户的常去场所以及在所述常去场所的出现时间;根据用户的常去场所以及在所述常去场所的出现时间,确定该常去场所针对所述用户的语义信息。

【技术特征摘要】
1.一种基于历史定位信息的数据挖掘方法,其特征在于,包括:
获取用户的历史定位信息;
根据所述历史定位信息,确定所述用户的常去场所以及在所述常去场所的出现时间;
根据用户的常去场所以及在所述常去场所的出现时间,确定该常去场所针对所述用户的语义信息。
2.根据权利要求1所述的数据挖掘方法,其特征在于,
根据所述历史定位信息,确定所述用户的常去场所,包括:
根据所述历史定位信息,确定用户在地图数据中,出现过的多个位置点;
通过基于密度的聚类分析法,在所有位置点中,确定用户的常去区域;
根据地图数据,确定用户的常去区域所对应的场所,并将该场所作为用户的常去场所。
3.根据权利要求2所述的数据挖掘方法,其特征在于,
通过基于密度的聚类分析法,在所述多个位置点中,确定用户的常去区域,包括:
以位置点为中心,分别针对每个位置点,确定一第一预设范围的位置区域;
将包含位置点最多、且位置点数量≥第一预设阈值的一个位置区域确定为用户的常去区域;
保存常去区域内所有的位置点,并对距该常去区域的中心点预设距离之内的所有位置点进行过滤;
基于过滤后剩余的位置点,重新确定用户另一个常去区域,直至用户的所有常去区域全部确认完毕。
4.根据权利要求2所述的数据挖掘方法,其特征在于,
根据所述历史定位信息,确定用户对应于常去场所的出现时间,包括:
根据所述历史定位信息,确定用户出现在常去场所的多个位置点所对应的定位时间;
将用户出现在常去场所的多个位置点对应的定位时间,作为用户在常去场所的出现时间。
5.根据权利要求4所述的数据挖掘方法,其特征在于,
根据用户的常去场所以及在所述常去场所的出现时间,确定该常去场所针对所述用户的语义信息,包括:
根据用户在所述常去区域的每个出现时间,与预设的办公时间、休闲时间以及居家时间进行匹配,得到一匹配结果;
若所述常去场所为工作场所,且所述匹配结果指示用户在办公时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户的公司;和/或
若所述常去场所为居住场所,且所述匹配结果指示用户在居家时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户的住宅;和/或
若所述常去场所为服务场所,且所述匹配结果指示用户在休闲时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户常去的服务地点。
6.根据权利要求2所述的数据挖掘方法,其特征在于,
若地图数据将所述常去场所细分为多个子区域,则所述方法还包括:
根据所述地图数据,确定所述常去场所中每个子区域所包含的位置点;
根据子区域中的位置点数量,确定所述常去区域中各个子区域的权重值;
若某一子区域的权重值大于其他子区域,且其权重值占所有子区域的权重之和的比例大于第二预设阈值,则将该子区域作为用户在所述常去场所中的具体位置。
7.根据权利要求2所述的数据挖掘方法,其特征在于,
根据所述历史定位信息,确定用户在地图数据中,出现过的多个位置点,包括:
将所述历史定位信息按照时间段进行分组;
根据每一组历史定位信息,在地图数据中,确定各时间段内用户出现过的所有位置点;
对同一时间段内用户出现过的所有位置点进行过滤,使得在同一时间段,一个第二预设范围的区域内,最多保留一个位置点。
8.根据权利要求7所述的数据挖掘方法,其特征在于,
对同一时间段内用户出现过的所有位置点进行过滤,使得在同一时间段,一个第二预设范围的区域内,最多保留一个位置点,包括:
以位置点为中心,分别针对以同一时间段的每个位置点,确定一第二预设范围的检测区域;
在包含位置点最多一个检测区域中,过滤掉除中心位置点以外的所有其它位置点;
根据过滤后剩余的位置点,重新确定一个包含位置点最多的检测区域,并进行过滤,直至同一时间段内没有可再过滤的位置点。
9.根据权利要求7所述的数据挖掘方法,其特征在于,
根据所述历史定位信息,确定用户出现过的多个位置点,还包括:
根据地图数据,确定并过滤掉坐落在道路、河流、湖泊以及海洋的位置点。
10.一种基于历史定位信息的数据挖掘装置,其特征在...

【专利技术属性】
技术研发人员:杨海军安华明王铁军赵礼剑朱熙
申请(专利权)人:北京四维图新科技股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1