The invention discloses a cluster data analysis method and device, including mobile cluster object data at predetermined time intervals corresponding to selected time points within a predetermined period of time the establishment of abnormal data table; dynamic; mobile cluster object data at each time point and abnormal data dynamic form within the abnormal data classification, initial the classification result, mobile cluster object data will not classified as abnormal data and abnormal data storage to dynamic table; from the beginning of the first time point, analysis on the change of the initial classification of the initial classification results of each time point and time point before a point in time, and according to the change of the initial classification of each the results of the time changes of identification, classification results. Through the establishment of classification data can be saved without abnormal dynamic data storage table, abnormal data, to avoid the loss of useful data, but also contains the abnormal data in the classification process, can make the data analysis more accurate.
【技术实现步骤摘要】
一种集群数据分析方法及装置
本申请涉及大数据移动数据分析领域,特别涉及一种集群数据分析方法及装置。
技术介绍
随着大数据技术的广泛普及,大数据的应用在日常生活中十分常见,尤其在数据厂商根据大数据的分析将广告、消息推送等针对性较强的内容有目的地推送给最适合的对象,这也是大数据的重要应用之一。同时,移动数据的增多,也就是包含对象的运动知识和位置信息的数据增多,可以更加有目的对对象销售产品。利用移动数据,还可以研究交通拥堵预测和动物迁徙。但是,在利用移动数据对移动对像的模式挖掘中,由于对象数据包含的类型多样性,且对数据分析的实时性要求较高,因此为挖掘移动数据的模式带来了挑战。通常挖掘移动数据的模式应用在例如,交通管理,物流配送和人群检测。这些需要分析集群的变化情况。而对于集群变化的本质:一个集群是否对应于一组汽车简单地消失或者集群中的成员迁移到其他集群中,新出现的集群是否反映新的车辆或者是出现新的目标群体,或者是现有客户的喜好转变而产生的。因此,研究集群变化情况是分析一段时间内的集群数据变化情况,首先将原始的数据划分为类,才可以以集群为单位研究,再通过不同时间点的集群的 ...
【技术保护点】
一种集群数据分析方法,其特征在于,所述方法包括:选取预定时间段内的相隔预定时间间隔的时间点对应的移动集群对象数据;建立异常数据动态表;将每个所述时间点的所述移动集群对象数据和所述异常数据动态表内的异常数据点进行分类,得到初始分类结果,将未分类的所述移动集群对象数据作为所述异常数据点并存储至异常数据动态表中;从第一个所述时间点开始,分析每个所述时间点的所述初始分类结果和所述时间点的前一个所述时间点的所述初始分类结果的变化,并根据所述变化的情况对每个所述时间的初始分类结果进行变化情况标识,得到分类结果。
【技术特征摘要】
1.一种集群数据分析方法,其特征在于,所述方法包括:选取预定时间段内的相隔预定时间间隔的时间点对应的移动集群对象数据;建立异常数据动态表;将每个所述时间点的所述移动集群对象数据和所述异常数据动态表内的异常数据点进行分类,得到初始分类结果,将未分类的所述移动集群对象数据作为所述异常数据点并存储至异常数据动态表中;从第一个所述时间点开始,分析每个所述时间点的所述初始分类结果和所述时间点的前一个所述时间点的所述初始分类结果的变化,并根据所述变化的情况对每个所述时间的初始分类结果进行变化情况标识,得到分类结果。2.根据权利要求1所述的方法,其特征在于,还包括:根据所述分类结果确定每个所述时间点的类与类之间的关系,构建移动集群模式树;根据所述移动集群模式树,确定相关移动集群频繁信息。3.根据权利要求2所述的方法,其特征在于,所述变化情况的标识,具体包括:保留、合并、分离、扩张、收缩、消失、出现。4.根据权利要求3所述的方法,其特征在于,所述建立异常数据动态表,包括:建立所述异常数据动态表;设置相关处理参数;其中,所述处理参数包括动态变化时间和更新时间。5.根据权利要求4所述的方法,其特征在于,所述将分类中没有归类的所述移动集群对象数据作为所述异常数据点并存储至异常数据动态表中,还包括:根据所述处理参数,判断所述异常数据点的存在时间是否超出所述更新时间;若是,则更新所述异常数据点。6.一种集群数据分析...
【专利技术属性】
技术研发人员:程良伦,傅应龙,王卓薇,
申请(专利权)人:广东工业大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。