【技术实现步骤摘要】
基于DNA序列表征的路径驾驶节奏模式分析方法及系统
[0001]本专利技术涉及时空轨迹数据挖掘领域,尤其涉及一种基于DNA序列表征的路径驾驶节奏模式分析方法及系统。
技术介绍
[0002]基于定位技术的飞速发展和位置服务技术的广泛应用,产生了大量的车辆行驶轨迹数据。在众多行驶轨迹数据中,出租车数据有着受客观因素约束少、轨迹数据量大、很少涉及隐私问题和空间覆盖率高等优点,为轨迹数据研究提供了优秀的素材。在现实生活中,出租车司机会在考虑动态道路通行能力的情况下选择当前的最佳路径,因此在出租车行驶过程中产生的大量的行驶轨迹数据隐藏着道路实时交通状态和出租车的路径选择经验。由于出租车的行驶经验包含着出租车司机在考虑道路通行能力、交通状况、沿途街道状况和天气状态等因素对道路选择的影响,而更贴近实际情况,因此对路径规划有很高的参考意义。如何从海量的出租车行驶数据中提取出出租车的路径选择经验已是轨迹数据挖掘和路径规划算法的重点研究方向。
[0003]在传统的路径规划算法中,往往注重计算两点在路网中的时间成本和距离成本,以此求得两点 ...
【技术保护点】
【技术特征摘要】
1.一种基于DNA序列表征的路径驾驶节奏模式分析方法,其特征在于,包括:S1:获取原始出租车轨迹数据集,对原始出租车轨迹数据集进行预处理,获得预处理后的出租车行程轨迹流数据集;S2:构建OD成本矩阵,将预处理后的出租车行程轨迹流数据集输入OD成本矩阵,获得每条轨迹流中各个轨迹点间在路网中的距离成本;S3:根据轨迹在路网中的距离成本结合轨迹点间的通过时间和平均速度,构造出轨迹的驾驶节奏序列;S4:通过Smith
‑
Waterman算法对各场景下的驾驶节奏序列进行相似性比对,计算获得各场景下的驾驶节奏序列之间的相似程度;S5:将相似程度作为得分,对各场景下的驾驶节奏序列进行聚类分析,获得各场景下出租车司机对于路径选择的模式和情感趋向。2.根据权利要求1所述的基于DNA序列表征的路径驾驶节奏模式分析方法,其特征在于,步骤S1具体为:清洗掉原始出租车轨迹数据集中的未运营车辆轨迹数据、故障车辆轨迹数据和空车轨迹数据,完成清洗的数据集即为行程轨迹数据集;将有效轨迹点数据按照载客情况划分出载客行程,获得每一段载客行程的轨迹点数据;将载客行程中偏移的轨迹点数据拟合到路网上,此时每一段载客行程的轨迹点数据即构成了对应行程的轨迹流,所有行程的轨迹流构成了出租车行程轨迹流数据集。3.根据权利要求1所述的基于DNA序列表征的路径驾驶节奏模式分析方法,其特征在于,步骤S2具体为:通过路网数据构建OD成本矩阵,依次将轨迹流中各个轨迹点数据分别载入OD成本矩阵的起始点和目的地点,计算所有轨迹流中各个轨迹点间的距离成本。4.根据权利要求1所述的基于DNA序列表征的路径驾驶节奏模式分析方法,其特征在于,步骤S3具体为:S31:按时间顺序依次读取出租车行程轨迹流数据集的轨迹流数据中的各个轨迹点,计算相邻时间前后的两个轨迹点的通过时间;获取两个轨迹点对应的距离成本,距离成本除以通过时间得到两个轨迹点对应的片段的平均速度;S32:若片段的平均速度小于或等于预设值,则保留该片段的两个轨迹点,否则舍弃该片段的两个轨迹点;S33:制定拥堵程度、速度区间与表示符号之间的对应关系,依据每个片段的平均速度,用特定符号表示出当前片段的拥堵程度;对轨迹流中所有片段依次进行符号化表示,即构成了一条形似DNA序列的符号序列,该符号序列即为轨迹流的驾驶节奏序列。5.根据权利要求1所述的基于DNA序列表征的路径驾驶节奏模式分析方法,其特征在于,步骤S4具体为:S41:根据起点与终点位置、行程距离和时段将驾驶节奏序列划分为不同场景下的驾驶节奏序列;S42:对于p,q两条驾驶节奏序列,建立打分规则,表达式如下:
其中,S(p
i
,q
j
)表示驾驶节奏序列p中第i
‑
1个符号与驾驶节奏序列q中第j
‑
1个符号比较的得分,3是当符号p
i
与q
j
相同时的分数,此时p
i
与q
j
都不为
‘‑’
,
‑
3是当符号p
i
与q
j
不同时或p
i
与q
j
至少有一个为
‘‑’
时的分;S43:|p|和|q|分别为两条驾驶节奏序列的长度,通过打分规则构建一个大小为(|...
【专利技术属性】
技术研发人员:杨林,路锐,左泽均,周顺平,
申请(专利权)人:中国地质大学武汉,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。