The invention requests protection of a peer-to-peer vehicle discovery method based on large flow data, including steps: firstly, clustering the traffic flow and the number of branches at the entrance of the entrance, and identifying the role of the entrance of the entrance through the class cluster of the entrance of the entrance, thus verifying the power law of the traffic flow at the entrance of the entrance. Secondly, the Spark_streaming time sliding window is introduced on the basis of the streaming data, and the context between vehicles is obtained according to the trajectory of the vehicle, so as to complete the creation and improvement of the peer corpus. Finally, the PDGC (plate_number dynamic graph computing) algorithm is proposed. Based on the dynamic corpus and the card role identification, the dynamic relationship graph between vehicles is established. The card role is used as the influence factor to correlate with the graph between vehicles. The edge cutting of the car relationship graph and the calculation of the edge weight between the same vehicles are carried out in real time. Get the same group. The complexity of data processing is effectively reduced. It can be used not only to search the similar trajectory, but also to mine the tracking vehicle by calculating the exit and entry of the vertex of the vehicle graph.
【技术实现步骤摘要】
一种基于流式大数据的同行车辆发现方法
本专利技术属于大数据挖掘领域,主要是涉及智能交通领域,尤其是一种基于大数据的同行车辆发现方法。
技术介绍
随着移动设备和识别技术的进步,大量的轨迹数据被记录下来,这些数据被集中用于轨迹聚类、交通管理、离群点检测、兴趣区域、隐私保护、位置推荐等方面。轨迹数据来源有两类,一种来自外部设备:卡口探头拍摄的移动对象信息数据,这种数据记录了移动对象的特征。另外一种轨迹数据是移动对象自己产生的:行人身上的移动设备产生的定位数据,车辆自带设备产生的GPS数据,包括移动对象的位置信息等数据。人们期望通过轨迹数据发现与特定对象一起移动的团体,即同行团体。例如,对动物轨迹研究可以让科学家们发现物种迁移的规律;对车辆轨迹的研究可以发现同行车组,应用到交通管理,公安治理和军事监视等领域。本文基于一种特殊的流式时空数据,即ANPR(车牌自动识别)数据建立模型来实时挖掘同行车组。当前,对于同行车辆挖掘问题主要集中在两个方向:(1)基于GPS轨迹数据获得同行车辆组,针对GPS数据进行同行车辆挖掘主要通过几种途径:基于轨迹相似性运用聚类算法得到同行车组;限制车辆之间的地理距离和一起移动的时间。(2)基于卡口探头拍摄数据挖掘同行车组。这种数据通常以流的形式传输到数据中心,用于进一步的分析和挖掘。一些学者处理流式数据,通过密度聚类尝试实时得到同行团体。还有部分学者采用分布式处理框架Hadoop和Spark,实现了频繁项集挖掘算法的并行化,并对频繁项集挖掘算法进行了优化。但是,实时发现同行车辆组属于动态挖掘问题,频繁项集的计算在静态数据集上效果更好,对于动 ...
【技术保护点】
1.一种基于流式大数据的同行车辆发现方法,其特征在于,包括以下步骤:S1:获取卡口摄像头拍摄的行驶在路上的车辆的数据,生成数据集;S2:提取相关属性,从获取到的数据集中提取同行车辆最密切的特征:包括车牌号、时间及卡口,将提取到的特征作为动态图计算模型的输入特征;S3:对卡口进行角色划分,卡口角色划分主要是通过车辆行驶轨迹得到的卡口属性作为聚类条件,通过聚类算法得到卡口类簇进而对卡口进行角色划分,同行车组经过不同类别卡口后,它们之间的权重得到不同程度的增加,卡口角色划分作为外部因子参与到动态图计算过程;S4:获取动态车牌数据集,将用于实验的自动车牌识别数据通过高吞吐量的分布式发布订阅消息系统Kafka处理为流式数据,根据ANPR数据流中的移动对象的特征信息引入滑动时间窗口机制,对特征信息进行时间切片化处理建立动态数据集;S5:根据动态车牌数据集建立动态图计算模型,用权重、出度、入度表示车辆车辆节点之间的关系,车辆实时轨迹用动态图进行表示,在实时计算过程中通过引入卡口角色对车辆之间形成的动态图进行剪枝、权重计算在内的步骤挖掘得到同行车辆组。
【技术特征摘要】
1.一种基于流式大数据的同行车辆发现方法,其特征在于,包括以下步骤:S1:获取卡口摄像头拍摄的行驶在路上的车辆的数据,生成数据集;S2:提取相关属性,从获取到的数据集中提取同行车辆最密切的特征:包括车牌号、时间及卡口,将提取到的特征作为动态图计算模型的输入特征;S3:对卡口进行角色划分,卡口角色划分主要是通过车辆行驶轨迹得到的卡口属性作为聚类条件,通过聚类算法得到卡口类簇进而对卡口进行角色划分,同行车组经过不同类别卡口后,它们之间的权重得到不同程度的增加,卡口角色划分作为外部因子参与到动态图计算过程;S4:获取动态车牌数据集,将用于实验的自动车牌识别数据通过高吞吐量的分布式发布订阅消息系统Kafka处理为流式数据,根据ANPR数据流中的移动对象的特征信息引入滑动时间窗口机制,对特征信息进行时间切片化处理建立动态数据集;S5:根据动态车牌数据集建立动态图计算模型,用权重、出度、入度表示车辆车辆节点之间的关系,车辆实时轨迹用动态图进行表示,在实时计算过程中通过引入卡口角色对车辆之间形成的动态图进行剪枝、权重计算在内的步骤挖掘得到同行车辆组。2.根据权利要求1所述的一种基于流式大数据的同行车辆发现方法,其特征在于,所述步骤S1获取卡口摄像头拍摄的行驶在路上的车辆的数据,生成数据集,具体包括:S11:获取数据,提取卡口摄像头采集的行驶车辆的所有数据;S12:对数据进行时间分片,根据“时间”字段,对每辆车的所有数据进行划分,考虑到同行车辆的特点,统计同一卡口在设定阈值间隔中的过车数量,其中,同行车辆组指的是两个或多个移动对象在短时间阈值内共同经过多个卡口的车辆组。3.根据权利要求1所述的一种基于流式大数据的同行车辆发现方法,其特征在于,所述步骤S2提取相关属性,主要分以下2个步骤。S21:提取相关属性。从获取到的数据集中提取同行车辆最密切的特征:车牌号、时间、卡口;S22:将提取到的属性根据时间维度进行序列化,获得每辆车的轨迹Tracev,通过轨迹得到卡口的分支数量,通过统计经过卡口的次数可以得到卡口特定时间段的车流量。4.根据权利要求3所述的一种基于流式大数据的同行车辆发现方法,其特征在于,...
【专利技术属性】
技术研发人员:刘宴兵,刘浩宇,程川云,肖云鹏,朱萌钢,帅杰,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:重庆,50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。