轨迹特征的提取方法、装置、存储介质及终端制造方法及图纸

技术编号:24498126 阅读:16 留言:0更新日期:2020-06-13 03:52
本发明专利技术实施例公开了一种轨迹特征的提取方法、装置、存储介质及终端。所述方法包括:获取至少两个时间区间内的用户位置数据;针对各个时间区间,根据所述时间区间内的用户位置数据确定所述时间区间内的位置中心点及位置中心点密度;将各个时间区间内的位置中心点构造的轨迹点向量和各个时间区间内的位置中心点密度构造的轨迹密度向量作为用户轨迹特征。通过采用上述技术方案,能够将离散非结构化的用户位置数据转化为结构化、标准化的用户行为轨迹特征,从而准确地刻画出用户的日常行为轨迹,有利于后续轨迹数据的深度挖掘及应用。

Extraction method, device, storage medium and terminal of track feature

【技术实现步骤摘要】
轨迹特征的提取方法、装置、存储介质及终端
本专利技术实施例涉及数据分析
,尤其涉及轨迹特征的提取方法、装置、存储介质及终端。
技术介绍
随着移动互联网的快速发展,基于用户位置的服务越来越多,如基于位置的个性化推荐服务或者基于位置信息的风控反欺诈服务。但是目前基于用户行为轨迹的服务比较少,目前除了地图、导航及打车等应用程序之外,其他应用程序获取的用户行为轨迹数据相对比较稀疏离散,非结构化,难以完美形成类似地图、导航及打车等应用程序构建的连续不中断的轨迹路线图,因此,针对稀疏离散的用户行为数据,难以提取用户的行为轨迹特征,进而会影响这一重要特征的业务应用。
技术实现思路
本专利技术实施例提供一种轨迹特征的提取方法、装置、存储介质及终端,以将离散非结构化的用户位置数据转化为结构化、标准化的用户行为轨迹特征。第一方面,本专利技术实施例提供了一种轨迹特征的提取方法,该方法包括:获取至少两个时间区间内的用户位置数据;针对各个时间区间,根据所述时间区间内的用户位置数据确定所述时间区间内的位置中心点及位置中心点密度;将各个时间区间内的位置中心点构造的轨迹点向量和各个时间区间内的位置中心点密度构造的轨迹密度向量作为用户轨迹特征。第二方面,本专利技术实施例还提供了一种轨迹特征的提取装置,该装置包括:用户位置数据获取模块,用于获取至少两个时间区间内的用户位置数据;位置中心点及密度确定模块,用于针对各个时间区间,根据所述时间区间内的用户位置数据确定所述时间区间内的位置中心点及位置中心点密度;用户轨迹特征提取模块,用于将各个时间区间内的位置中心点构造的轨迹点向量和各个时间区间内的位置中心点密度构造的轨迹密度向量作为用户轨迹特征。第三方面,本专利技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术实施例提供的轨迹特征的提取方法。第四方面,本专利技术实施例提供了一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本专利技术实施例提供的轨迹特征的提取方法。本专利技术实施例中提供的轨迹特征的提取方法,获取至少两个时间区间内的用户位置数据,并针对各个时间区间,根据时间区间内的用户位置数据确定时间区间内的位置中心点及位置中心点密度,最后将各个时间区间内的位置中心点构造的轨迹点向量和各个时间区间内的位置中心点密度构造的轨迹密度向量作为用户轨迹特征。通过采用上述技术手段,能够将离散非结构化的用户位置数据转化为结构化、标准化的用户行为轨迹特征,从而准确地刻画出用户的日常行为轨迹,有利于后续轨迹数据的深度挖掘及应用。附图说明图1为本专利技术实施例提供的一种轨迹特征的提取方法的流程示意图;图2为本专利技术实施例提供的基于各个时间区间内的位置中心点构造的用户轨迹示意图;图3为本专利技术实施例提供的另一种轨迹特征的提取方法的流程示意图;图4为本专利技术实施例提供的一种轨迹特征的提取装置的结构框图;图5为本专利技术实施例提供的一种终端的结构框图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。图1为本专利技术实施例提供的一种轨迹特征的提取方法的流程示意图,该方法可以由轨迹特征的提取装置执行,其中该装置可由软件和/或硬件实现,一般可集成在终端设备中。如图1所示,该方法包括:步骤101、获取至少两个时间区间内的用户位置数据。示例性的,终端可以包括但不限于智能手机、平板电脑、笔记本电脑、掌上电脑等终端设备。其中,该终端的操作系统可以包括但不限于Android操作系统、IOS操作系统、WindowsPhone8操作系统等。在本专利技术实施例中,获取至少两个时间区间内的用户位置数据,其中,至少两个时间区间可以连续,也可以不连续,还可以部分连续。例如,获取8-12点,12-16点,16-20点这三个连续的时间区间内的用户位置数据;又如,获取8-12点,13-17点,18-22点这三个不连续的时间区间内的用户位置数据;再如,获取8-11点,13-16点,16-19点,20-23点这四个时间区间内的用户位置数据。另外,至少两个时间区间中的每个时间区间的长度可以相同,也可以不同,本专利技术实施例对此也不做限定。示例性的,可以将用户使用的移动终端(如手机)中的定位模块获取的位置信息作为用户位置数据。其中,可对获取至少两个时间区间内大量的原始用户位置数据进行预处理,删除其中非有效的位置数据,如去除属性缺失的位置数据。可选的,获取至少两个时间区间内的用户位置数据,包括:获取预设时间段内的用户位置数据集;获取按照预设时间划分规则确定的至少两个时间区间;从所述用户位置数据集中提取各个时间区间内的用户位置数据。示例性的,获取预设时间段内的用户位置数据集,其中,用户位置数据集可以理解为大量的用户位置数据构成的集合,例如,收集用户在当前时间往前追溯60天内的用户位置数据。其中,本专利技术实施例可以根据需要对预设时间段进行调整,如预设时间段可以是1个月、3个月或6个月等等。获取按照预设时间划分规则确定的至少两个时间区间,例如,将每天24小时按小时划分为若干个时间区间,具体的,可以将一天的时间划分为0-4点,4-8点,8-12点,12-16点,16-20点,20-24点6个这样的时间区间。需要说明的是,本专利技术实施例对预设时间划分规则不做限定,可以将一天的时间按3小时或6小时一个时间区间长度进行划分。另外,由于0-5点这段时间通常为也用户休息的时间,用户的位置数据的数据量较少或几乎为零,因此,可以只对5-24点这段时间进行时间区间的划分。最后,在预设时间段内的用户位置数据集中,提取各个时间区间内的用户位置数据,也即将预设时间段内的用户位置数据划分到各个时间区间内,以此作为时间区间内对应的用户位置数据。步骤302、针对各个时间区间,根据所述时间区间内的用户位置数据确定所述时间区间内的位置中心点及位置中心点密度。可选的,根据所述时间区间内的用户位置数据确定所述时间区间内的位置中心点,包括:基于预先设定的聚类算法对所述时间区间内的用户位置数据进行聚类,根据聚类结果确定聚类中心点;将所述聚类中心点作为所述时间区间内的位置中心点。这样设置的好处在于,可以准确、快速地确定出各个时间区间内用户位置数据的位置中心点。示例性的,分别对各个时间区间内的用户位置数据进行聚类分析,根据分析结果确定聚类中心点,并将聚类中心点作为时间区间内的位置中心点。可以理解的是,可以针对每个时间区间内的位置数据获取对应的位置中心点,因此,时间区间的数量与位置中心点的数量相同。需要说明的是,本专利技术是实施例对预先设定的聚类算法不做限定,可以是基于位置的聚类算法,如Kmeans,Kmedians,还可以是层次聚类算法,本文档来自技高网...

【技术保护点】
1.一种轨迹特征的提取方法,其特征在于,包括:/n获取至少两个时间区间内的用户位置数据;/n针对各个时间区间,根据所述时间区间内的用户位置数据确定所述时间区间内的位置中心点及位置中心点密度;/n将各个时间区间内的位置中心点构造的轨迹点向量和各个时间区间内的位置中心点密度构造的轨迹密度向量作为用户轨迹特征。/n

【技术特征摘要】
1.一种轨迹特征的提取方法,其特征在于,包括:
获取至少两个时间区间内的用户位置数据;
针对各个时间区间,根据所述时间区间内的用户位置数据确定所述时间区间内的位置中心点及位置中心点密度;
将各个时间区间内的位置中心点构造的轨迹点向量和各个时间区间内的位置中心点密度构造的轨迹密度向量作为用户轨迹特征。


2.根据权利要求1所述的方法,其特征在于,获取至少两个时间区间内的用户位置数据,包括:
获取预设时间段内的用户位置数据集;
获取按照预设时间划分规则确定的至少两个时间区间;
从所述用户位置数据集中提取各个时间区间内的用户位置数据。


3.根据权利要求1所述的方法,其特征在于,根据所述时间区间内的用户位置数据确定所述时间区间内的位置中心点,包括:
基于预先设定的聚类算法对所述时间区间内的用户位置数据进行聚类,根据聚类结果确定聚类中心点;
将所述聚类中心点作为所述时间区间内的位置中心点。


4.根据权利要求3所述的方法,其特征在于,根据所述时间区间内的用户位置数据确定所述时间区间内的位置中心点密度,包括:
针对各个位置中心点,从所述位置中心点对应的时间区间内的用户位置数据中确定与所述位置中心点的距离小于预设距离阈值的目标位置数据;
根据所述目标位置数据以及所述时间区间内的用户位置数据计算位置中心点密度。


5.根据权利要求4所述的方法,其特征在于,根据所述目标位置数据以及所述时间区间内的用...

【专利技术属性】
技术研发人员:胡仕军
申请(专利权)人:深圳市前海随手数据服务有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1