一种数据分析方法及装置制造方法及图纸

技术编号:17596978 阅读:70 留言:0更新日期:2018-03-31 10:11
本发明专利技术实施例公开了一种数据分析方法及装置,该方法包括:利用预设的主题模型,分别对目标车辆的车辆GPS轨迹以及对应的目标移动终端的移动终端GPS轨迹进行分类,并根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,以及每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息。应用本发明专利技术实施例,以实现根据GPS数据,得到待分析人员的行为信息。

A method and device for data analysis

The embodiment of the invention discloses a data analysis method and device, the method includes: using the default theme model, respectively GPS vehicle trajectory of the target vehicle and the corresponding target mobile terminal GPS trajectory classification, vehicle GPS data and according to each type of vehicle and vehicle trajectory GPS GPS path contains the corresponding GPS information, the mobile terminal and GPS data of each type of the target mobile terminal, mobile terminal and mobile terminal GPS path GPS path contains the corresponding GPS information, and to determine the target vehicle corresponding analysis personnel in the first predetermined time information. The application of the invention is applied to realize the behavior information of the personnel to be analyzed according to the GPS data.

【技术实现步骤摘要】
一种数据分析方法及装置
本专利技术涉及数据挖掘
,特别涉及一种数据分析方法及装置。
技术介绍
随着科技的发展,智能终端越来越融入人们的生活。并且随着定位技术越来越好,人们出行时越来越倾向于使用智能终端所配置的定位技术,为自己的出行进行导航,而非利用纸质的地图等进行导航。在利用智能终端进行导航的过程中,会产生相应的GPS数据,这些GPS数据中隐含有大量的与使用者相关的数据信息,如:通过GPS数据可以分析出使用者是经常出入娱乐场所还是运动场所,等等。进而根据这些GPS数据,分析得到使用者的兴趣爱好以及生活习惯等等。然而,现有技术中,并没有相对于这些信息的相关利用。那么如何利用这些GPS数据,分析得到相关人员的行为分析信息成为亟待解决的问题。
技术实现思路
本专利技术实施例公开了一种数据分析方法及装置,以实现根据GPS数据,得到相关人员的行为信息。具体方案如下:一方面,本专利技术实施例提供了一种数据分析方法,所述方法包括:获得目标车辆在第一预定时间内的车辆全球定位系统GPS轨迹,以及所述目标车辆对应的目标移动终端的移动终端GPS轨迹,其中,所述车辆GPS轨迹包括所述目标车辆所定位的车辆G本文档来自技高网...
一种数据分析方法及装置

【技术保护点】
一种数据分析方法,其特征在于,所述方法包括:获得目标车辆在第一预定时间内的车辆全球定位系统GPS轨迹,以及所述目标车辆对应的目标移动终端的移动终端GPS轨迹,其中,所述车辆GPS轨迹包括所述目标车辆所定位的车辆GPS数据,所述移动终端GPS轨迹包括所述目标移动终端所定位的移动终端GPS数据;依据预设的第一主题模型,对该目标车辆的车辆GPS轨迹进行分类,并且依据预设的第二主题模型,对该目标移动终端的移动终端GPS轨迹进行分类;根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,以及每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对...

【技术特征摘要】
1.一种数据分析方法,其特征在于,所述方法包括:获得目标车辆在第一预定时间内的车辆全球定位系统GPS轨迹,以及所述目标车辆对应的目标移动终端的移动终端GPS轨迹,其中,所述车辆GPS轨迹包括所述目标车辆所定位的车辆GPS数据,所述移动终端GPS轨迹包括所述目标移动终端所定位的移动终端GPS数据;依据预设的第一主题模型,对该目标车辆的车辆GPS轨迹进行分类,并且依据预设的第二主题模型,对该目标移动终端的移动终端GPS轨迹进行分类;根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,以及每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息。2.根据权利要求1所述的方法,其特征在于,所述获得目标车辆在第一预定时间内的车辆全球定位系统GPS轨迹,以及所述目标车辆对应的目标移动终端的移动终端GPS轨迹,包括:获得所述第一预定时间内所述目标车辆的车载设备收集的所述车辆GPS数据,以及所述目标车辆对应的多个移动终端收集的移动终端GPS数据;根据预设的第一轨迹划分规则以及所述车辆GPS数据,确定所述目标车辆的车辆GPS轨迹,并根据所述第一轨迹划分规则以及多个移动终端收集的移动终端GPS数据,确定每个移动终端的移动终端GPS轨迹;对比所述车辆GPS轨迹以及每个移动终端的移动终端GPS轨迹,确定与所述目标车辆对应的目标移动终端以及该目标移动终端的移动终端GPS轨迹,其中,所述目标移动终端的移动终端GPS轨迹与所述车辆GPS轨迹相似度最高。3.根据权利要求1所述的方法,其特征在于,所述依据预设的第一主题模型,对该目标车辆的车辆GPS轨迹进行分类,并且依据预设的第二主题模型,对该目标移动终端的移动终端GPS轨迹进行分类,包括:将所述目标车辆的车辆GPS轨迹输入所述第一主题模型;获得所述第一主题模型输出的每条车辆GPS轨迹对应的第一主题;将第一主题相同的车辆GPS轨迹划分为一类;将所述目标移动终端的移动终端GPS轨迹输入所述第二主题模型;获得所述第二主题模型输出的每条所述目标移动终端的移动终端GPS轨迹对应的第二主题;将第二主题相同的所述目标移动终端的移动终端GPS轨迹划分为一类。4.根据权利要求3所述的方法,其特征在于,所述第一主题模型和第二主题模型均为隐含狄利克雷分布LDA模型;所述第一主题模型包括第一GPS数据、第一主题和第一GPS轨迹三层结构,所述第二主题模型包括第二GPS数据、第二主题和第二GPS轨迹三层结构;所述方法还包括建立主题模型的过程,所述过程包括:获得多个样本车辆在第二预定时间内的第一GPS数据,以及所述样本车辆对应的多个样本移动终端的第二GPS数据,其中,所述第一GPS数据包括对应样本车辆的第一样本标识,所述第二GPS数据包括对应样本移动终端的第二样本标识;从所述第一GPS数据中,确定每个第一样本标识对应的第一GPS数据,并从所述第二GPS数据中,确定每个第二样本标识对应的第二GPS数据;根据预设的轨迹划分规则以及对应同一个第一样本标识的第一GPS数据,确定所对应的样本车辆的第一GPS轨迹,并根据所述轨迹划分规则以及对应同一个第二样本标识的第二GPS数据,确定所对应的样本移动终端的第二GPS轨迹;分别进行LDA学习,获得每个第一GPS数据与第一主题的对应关系,以及第一GPS数据的第一主题与第一GPS轨迹的第一主题间的第一转换关系,并获得每个第二GPS数据与第二主题的对应关系,以及第二GPS数据的第二主题与第二GPS轨迹的第二主题间的第二转换关系;所述获得所述第一主题模型输出的每条车辆GPS轨迹对应的第一主题,包括:所述第一主题模型针对输入的每条第一GPS轨迹所包含的第一GPS数据,根据每个第一GPS数据与第一主题的对应关系确定车辆GPS数据对应的第一主题,并根据第一GPS数据的第一主题与第一GPS轨迹的第一主题间的第一转换关系确定车辆GPS轨迹的第一主题输出;获得所输出的每条第一GPS轨迹的第一主题;所述获得所述第二主题模型输出的每条所述目标移动终端的移动终端GPS轨迹对应的第二主题,包括:所述第二主题模型针对输入的每条第二GPS轨迹所包含的第二GPS数据,根据每个第二GPS数据与第二主题的对应关系确定所述目标移动终端的移动终端GPS数据对应的第二主题,并根据第二GPS数据的第二主题与第二GPS轨迹的第二主题间的第二转换关系确定所述目标移动终端的移动终端GPS轨迹的第二主题输出;获得所输出的每条第二GPS轨迹的第二主题。5.根据权利要求2所述的方法,其特征在于,所述车辆GPS数据包含车辆起始地点标识及对应的车辆起始定位时间和车辆终止地点标识及对应的车辆终止定位时间,所述目标移动终端GPS数据包含终端起始地点标识及对应的终端起始定位时间和终端终止地点标识及对应的终端终止定位时间;所述根据预设的第一轨迹划分规则以及所述车辆GPS数据,确定所述目标车辆的车辆GPS轨迹,包括:按照所对应的车辆起始定位时间的先后顺序,排序所述车辆GPS数据;对每两个相邻的车辆GPS数据,依据排序在前的车辆GPS数据所对应的车辆终止定位时间以及排序在后的车辆GPS数据所对应的车辆起始定位时间,确定每两个相邻的车辆GPS数据的第一时间差;当所述第一时间差超过预设的第一轨迹划分时间阈值时,将所对应的两个相邻的车辆GPS数据确定为第一轨迹划分界限,其中,车辆起始定位时间在前的车辆GPS数据对应的车辆终止地点标识为前一个车辆GPS轨迹终点,车辆起始定位时间在后的车辆GPS数据对应的车辆起始地点标识为后一个车辆GPS轨迹起点;根据所述第一轨迹划分界限以及所述车辆GPS数据,确定所述目标车辆的车辆GPS轨迹;所述根据所述第一轨迹划分规则以及多个移动终端收集的移动终端GPS数据,确定每个移动终端的移动终端GPS轨迹,包括:按照所对应的终端起始定位时间的先后顺序,排序所述移动终端GPS数据;对每两个相邻的移动终端GPS数据,依据排序在前的移动终端GPS数据所对应的终端终止定位时间以及排序在后的移动终端GPS数据所对应的终端起始定位时间,确定每两个相邻的移动终端GPS数据的第二时间差;当所述第二时间差超过所述第一轨迹划分时间阈值时,将所对应的两个相邻的移动终端GPS数据确定为第二轨迹划分界限,其中,终端起始定位时间在前的移动终端GPS数据对应的终端终止地点标识为前一个移动终端GPS轨迹终点,终端起始定位时间在后的移动终端GPS数据对应的终端起始地点标识为后一个移动终端GPS轨迹起点;根据所述第二轨迹划分界限以及所述移动终端GPS数据,确定所述目标车辆的每个移动终端GPS轨迹。6.根据权利要求4所述的方法,其特征在于,所述第一GPS数据包含第一起始地点标识及对应的第一起始定位时间和第一终止地点标识及对应的第一终止定位时间,所述第二GPS数据包含第二起始地点标识及对应的第二起始定位时间和第二终止地点标识及对应的第二终止定位时间;所述根据预设的轨迹划分规则以及对应同一个第一样本标识的第一GPS数据,确定所对应的样本车辆的第一GPS轨迹,包括:按照所对应的第一起始定位时间的先后顺序,排序所述第一GPS数据;对每两个相邻的第一GPS数据,依据排序在前的第一GPS数据所对应的第一终止定位时间以及排序在后的第一GPS数据所对应的第一起始定位时间,确定每两个相邻的第一GPS数据的第三时间差;当所述第三时间差超过预设的第二轨迹划分时间阈值时,将所对应的两个相邻的第一GPS数据作为第三轨迹划分界限,其中,第一起始定位时间在前的第一GPS数据对应的第一终止地点标识为前一个第一GPS轨迹终点,第一起始定位时间在后的第一GPS数据对应的第一起始地点标识为后一个第一GPS轨迹起点;根据所述第三轨迹划分界限以及所述第一GPS数据,确定所对应的样本车辆的第一GPS轨迹;所述根据所述轨迹划分规则以及对应同一个第二样本标识的第二GPS数据,确定所对应的样本移动终端的第二GPS轨迹,包括:按照所对应的第二起始定位时间的先后顺序,排序所述第二GPS数据;对每两个相邻的第二GPS数据,依据排序在前的第二GPS数据所对应的第二终止定位时间以及排序在后的第二GPS数据所对应的第二起始定位时间,确定每两个相邻的第二GPS数据的第四时间差;当所述第四时间差超过所述第二轨迹划分时间阈值时,将所对应的两个相邻的第二GPS数据作为第四轨迹划分界限,其中,第二起始定位时间在前的第二GPS数据对应的第二终止地点标识为前一个第二GPS轨迹终点,第二起始定位时间在后的移动终端GPS数据对应的第二起始地点标识为后一个第二GPS轨迹起点;根据所述第四轨迹划分界限以及所述第二GPS数据,确定所对应的样本移动终端的第二GPS轨迹。7.根据权利要求1-6任一项所述的方法,其特征在于,所述方法还包括:获得所述目标移动终端在所述第一预定时间内的终端交互数据,其中,所述终端交互数据包括日志交互数据和应用程序信息,其中,所述日志交互数据用于标识所述目标移动终端中各应用程序信息对应的应用程序的使用频率;依据预设的第三主题模型,对所获得的终端交互数据,进行分类;根据每一类终端交互数据以及所对应的应用程序信息,确定所述目标移动终端在所述第一预定时间内的子行为信息;所述根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,以及每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息,包括;根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,以及所述子行为信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息。8.根据权利要求1-6任一项所述的方法,其特征在于,所述GPS信息包括:定位地点对应的经纬度信息、定位地点对应的预定范围内的建筑信息或定位地点对应的环境信息;所述根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,以及每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息,包括:根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的定位地点对应的经纬度信息确定所述目标车辆对应的第一地域主题;或,根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的定位地点对应的预定范围内的建筑信息确定所述目标车辆对应的第一建筑主题;或,根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的定位地点对应的环境信息确定所述目标车辆对应的第一环境主题;根据每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的定位地点对应的经纬度信息确定所述目标移动终端对应的第二地域主题;或,根据每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的定位地点对应的预定范围内的建筑信息确定所述目标移动终端对应的第二建筑主题;或,根据每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的定位地点对应的环境信息确定所述目标移动终端对应的第二环境主题;根据所确定的所述目标车辆对应的第一地域主题、第一建筑主题或第一环境主题,以及所确定的所述目标移动终端对应的第二地域主题、第二建筑主题或第二环境主题,确定所述待分析人员在所述第一预定时间内的行为信息...

【专利技术属性】
技术研发人员:何春雷管国辰林武康徐宇垚
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1