一种基于货运轨迹数据的车辆自发编队模式挖掘方法技术

技术编号:24687291 阅读:34 留言:0更新日期:2020-06-27 09:01
本发明专利技术公开了一种基于货运轨迹数据的车辆自发编队模式挖掘方法,根据每日海量货车轨迹数据,完成基于数据挖掘方法的货车自发编队模式搜索;并创新性的提出了全流程处理框架,通过设置七个数据库,使用改进的运程估算方法、地图匹配方法、P‑OPTICS算法等完成估算每辆货车当日货运行程、货车行程定位点地图匹配及坐标修复、热点线路及其挖掘时段拟定、每时刻货车编队集合挖掘、指定线路及时间段下货车自发编队模式挖掘及其评价等任务,从而在海量货运轨迹数据中抽取运程等关键信息同时,完成指定道路段或时间段下货车自发编队模式挖掘任务,从而在分析编队模式特征的同时为日后自动驾驶背景下的货车编队行驶工作提供业务参考。

A mining method of vehicle spontaneous formation pattern based on Freight Track Data

【技术实现步骤摘要】
一种基于货运轨迹数据的车辆自发编队模式挖掘方法
本专利技术涉及海量货运轨迹定位数据特征挖掘
,特别涉及一种基于货运轨迹数据的车辆自发编队模式挖掘方法。
技术介绍
随着我国经济的飞速发展与公路修建里程的大幅增加,公路货运规模连年提升并稳居我国货运行业主导地位。公路货运的蓬勃发展背后也带来了环境污染、能源危机及交通安全等问题,受到了社会各界的广泛关注。随着智能交通系统及智能车路协同系统的加快建设,一种主张货运卡车以较短间距队列行驶的新型运输方式——货车编队行驶将从根本上缓解公路货运存在的诸多污染及安全问题。目前,货车编队行驶已被欧美等发达国家封闭实验并验证其有效性与安全性,但仍处在实验场地调试运行阶段,尚未商业化或大规模化落地运行,目前货车编队行驶涉及到的主要技术要求如表1所示,运行方式如图1所示:表1货车编队行驶涉及到的主要技术要求随着自动驾驶技术与5G互联通信技术的不断发展,在路测装置配合下,该技术的落地实施将在不远的未来实现。得益于较低的货车间距,编队行驶中领头车辆与跟随车辆最高可减少32%空气阻力因而大幅节省燃油消耗,降低车队运营成本的同时减少了二氧化碳、氮氢化合物等有毒有害气体的排放;同时,相关技术可在较近跟车间距下有效降低应急反应时间并减少人为失误,进而减少追尾事故及拥堵发生、压缩道路空间使用量,增强道路通行能力。但是,该技术的实现离不开自动驾驶技术在货运车辆中的不断普及、车辆网通信技术的不断覆盖及重点道路相关基础设施的不断健全,其商业化与大规模实施仍需一定时间。当前我国已健全各省货运联网联控平台以监控重点货运车辆每日轨迹数据及其运输及车辆状态,每日均可积累海量轨迹数据。考虑到货运编组在后期推行中涉及到重点建设道路段挖掘、可行性及应用前景分析等诸多事宜,同时当前货运中已存在货运车辆群在短暂时段内体现自发编队行驶特征,开发一种框架及其挖掘技术以揭示分析省内货车自发编队行驶规模及特征对后期货运编队行驶技术落地应用具有较高指导意义。因此,如何依靠海量货运轨迹定位数据进行货车自发编队模式挖掘及其框架构建是该领域技术人员亟需解决的问题。
技术实现思路
鉴于上述问题,本专利技术提供一种至少解决上述部分技术问题的基于货运轨迹数据的车辆自发编队模式挖掘方法,该方法在海量货运轨迹数据中抽取运程等关键信息同时,完成指定道路段或时间段下货车自发编队模式挖掘任务,从而在分析编队模式特征的同时为日后自动驾驶背景下的货车编队行驶工作提供业务参考。本专利技术实施例提供一种基于货运轨迹数据的车辆自发编队模式挖掘方法,包括:第一步:采集拟挖掘自发编队模式省份的当日货车定位数据并提取关键字段,准备路网地理数据文件:从货运车辆定位监控系统抽取单日收集到的小时数据,以车辆为单位依次抽取当日轨迹定位数据,提取识别信息、定位信息、驾驶信息并加入货运车辆轨迹数据库;从地图数据库抽取道路信息,划分高速公路、国道、省道、普通道路并附加对应行驶速度限速字段,形成路网地理数据文件;第二步:轨迹数据清洗:抽取所述货运车辆轨迹数据库中每个轨迹数据,依次以单个货车轨迹数据为单位根据预设准则进行数据清洗;第三步:切分货运行程:抽取经过数据清洗的货运车辆轨迹数据库中每个轨迹数据,筛选有效货运行程定位点并初步划分货运行程序号,结合该货车当日货运特征确定货运行程终止合理时间阈值以聚合初步货运行程序号,形成货运行程信息并加入运程数据库;第四步:完成地图匹配及定位修复:抽取所述运程数据库中的每条运程数据,按照起、终点指示的索引号抽取对应车辆定位数据;根据轨迹定位点与候选道路间垂线距离、角度差异及速度差异,寻找每个所述定位数据对应的最佳道路段,将原始定位修复至最佳对应道路垂点并记录对应最佳道路段序号、名称、道路等级及道路宽度信息,并将添加信息后的定位数据以运程为单位添加入匹配数据库;第五步:使用多源数据及地理信息软件验证货运行程切分效果:对于货运行程起、终点及全程定位均在分析省内的运程,采用货运调查数据起、终点均在对应分析省内的运距同切分货运行程运距分布特征进行比对,评价货运行程大体切分效果;对于货运行程起、终点任意一点或全部处于分析省外的货运行程,采用地理信息软件分析其当日货运轨迹并与切分货运行程结果进行比对,评价货运行程大体切分效果;第六步:分析道路使用情况并确定重点道路段及其挖掘时段:在给定道路等级的前提下,抽取所述路网地理数据文件中对应道路数据;以道路唯一识别号为连接字段汇总所述匹配数据库中对应出现在该路段的货车个数,确定挖掘道路段;统计并分析不同小时出现在所述道路段的货车个数,确定挖掘时段;第七步:确定待分析轨迹库及其对应时间信息库与车辆信息库,修复异常定位时间:从所述匹配数据库和所述运程数据库中,抽取所述挖掘时段内通过目标挖掘道路段的运程信息及其对应定位数据,加入待分析轨迹库;迭代所述待分析轨迹库内定位数据集的起、终点时间以确定自发编队搜索时间范围,按照货运定位装置更新时间及频率划分分析时间戳,结合时间戳唯一识别代码共同加入时间信息库;迭代所述待分析轨迹库内定位数据以修复异常时间值,同时将对应车辆唯一识别字段结合从0开始的车辆唯一识别代码共同加入车辆信息库;第八步:确定每一时刻下的编队车辆集合,加入编队特征库:迭代所述时间信息库中时间戳信息,由所述待分析轨迹库抽取当前时间戳下存在定位信息的全部货车定位数据,逐时间戳按照编队车辆集合特征要求,使用P-OPTICS算法挖掘体现编队特征的全部车辆集合,并将涉及到的所述车辆唯一识别代码、时间戳唯一识别代码、车辆所属编队集合代号、车辆当前时间戳下经纬度信息加入编队特征库;第九步:挖掘货车自发编队模式:抽取所述编队特征库中全部时间戳下的车辆自发编队信息,采用改进后的时、空二维闭频繁挖掘算法,综合使用Apriori剪枝、闭频繁挖掘算法,寻找体现自发编队特征时间最长的最大货车集合,以完成自发编队模式挖掘任务;第十步:检验自发编队模式挖掘效果:评估目标挖掘道路在分析时段内货车自发编队行驶规模。与现有技术相比,本专利技术公开提供了一种基于货运轨迹数据的车辆自发编队模式挖掘方法,具有如下优点:(1)本专利技术结合当前货运车辆定位系统数据特点及人工调查数据及分析省内路网数据文件特征,针对挖掘货车自发编队行驶模式这一挖掘目的,开发出一套从定位系统原始数据抽取每日货车轨迹数据并开展运程切分与地图匹配,后经过重点分析路段及时间段筛选涉及货运定位数据,判断每时刻编队特征集合并最终跨时刻获得货车自发编队模式的系列流程,并构建出对应数据库及其包含数据内容框架,具有较强的实施效果及应用价值。(2)本专利技术在达成最终自发编队模式挖掘之前,为保证挖掘质量及提高挖掘速度而进行的运程切分及其核验、定位点地图匹配及矫正过程针对货运行程特征及海量货运定位数据进行了适配。其中,运程切分及其核验在将货运行程划分为省内运输及跨省运输下,差异性制定划分阈值,提高运程划分针对性及有效性;定位点地图匹配及矫正过程综合运用距离、角本文档来自技高网
...

【技术保护点】
1.一种基于货运轨迹数据的车辆自发编队模式挖掘方法,其特征在于,包括:/n第一步:采集拟挖掘自发编队模式省份的当日货车定位数据并提取关键字段,准备路网地理数据文件:从货运车辆定位监控系统抽取单日收集到的小时数据,以车辆为单位依次抽取当日轨迹定位数据,提取识别信息、定位信息、驾驶信息并加入货运车辆轨迹数据库;从地图数据库抽取道路信息,划分高速公路、国道、省道、普通道路并附加对应行驶速度限速字段,形成路网地理数据文件;/n第二步:轨迹数据清洗:抽取所述货运车辆轨迹数据库中每个轨迹数据,依次以单个货车轨迹数据为单位根据预设准则进行数据清洗;/n第三步:切分货运行程:抽取经过数据清洗的货运车辆轨迹数据库中每个轨迹数据,筛选有效货运行程定位点并初步划分货运行程序号,结合该货车当日货运特征确定货运行程终止合理时间阈值以聚合初步货运行程序号,形成货运行程信息并加入运程数据库;/n第四步:完成地图匹配及定位修复:抽取所述运程数据库中的每条运程数据,按照起、终点指示的索引号抽取对应车辆定位数据;根据轨迹定位点与候选道路间垂线距离、角度差异及速度差异,寻找每个所述定位数据对应的最佳道路段,将原始定位修复至最佳对应道路垂点并记录对应最佳道路段序号、名称、道路等级及道路宽度信息,并将添加信息后的定位数据以运程为单位添加入匹配数据库;/n第五步:使用多源数据及地理信息软件验证货运行程切分效果:对于货运行程起、终点及全程定位均在分析省内的运程,采用货运调查数据起、终点均在对应分析省内的运距同切分货运行程运距分布特征进行比对,评价货运行程大体切分效果;/n对于货运行程起、终点任意一点或全部处于分析省外的货运行程,采用地理信息软件分析其当日货运轨迹并与切分货运行程结果进行比对,评价货运行程大体切分效果;/n第六步:分析道路使用情况并确定重点道路段及其挖掘时段:在给定道路等级的前提下,抽取所述路网地理数据文件中对应道路数据;以道路唯一识别号为连接字段汇总所述匹配数据库中对应出现在该路段的货车个数,确定挖掘道路段;统计并分析不同小时出现在所述道路段的货车个数,确定挖掘时段;/n第七步:确定待分析轨迹库及其对应时间信息库与车辆信息库,修复异常定位时间:从所述匹配数据库和所述运程数据库中,抽取所述挖掘时段内通过目标挖掘道路段的运程信息及其对应定位数据,加入待分析轨迹库;/n迭代所述待分析轨迹库内定位数据集的起、终点时间以确定自发编队搜索时间范围,按照货运定位装置更新时间及频率划分分析时间戳,结合时间戳唯一识别代码共同加入时间信息库;迭代所述待分析轨迹库内定位数据以修复异常时间值,同时将对应车辆唯一识别字段结合从0开始的车辆唯一识别代码共同加入车辆信息库;/n第八步:确定每一时刻下的编队车辆集合,加入编队特征库:迭代所述时间信息库中时间戳信息,由所述待分析轨迹库抽取当前时间戳下存在定位信息的全部货车定位数据,逐时间戳按照编队车辆集合特征要求,使用P-OPTICS算法挖掘体现编队特征的全部车辆集合,并将涉及到的所述车辆唯一识别代码、时间戳唯一识别代码、车辆所属编队集合代号、车辆当前时间戳下经纬度信息加入编队特征库;/n第九步:挖掘货车自发编队模式:抽取所述编队特征库中全部时间戳下的车辆自发编队信息,采用改进后的时、空二维闭频繁挖掘算法,综合使用Apriori剪枝、闭频繁挖掘算法,寻找体现自发编队特征时间最长的最大货车集合,以完成自发编队模式挖掘任务;/n第十步:检验自发编队模式挖掘效果:评估目标挖掘道路在分析时段内货车自发编队行驶规模。/n...

【技术特征摘要】
1.一种基于货运轨迹数据的车辆自发编队模式挖掘方法,其特征在于,包括:
第一步:采集拟挖掘自发编队模式省份的当日货车定位数据并提取关键字段,准备路网地理数据文件:从货运车辆定位监控系统抽取单日收集到的小时数据,以车辆为单位依次抽取当日轨迹定位数据,提取识别信息、定位信息、驾驶信息并加入货运车辆轨迹数据库;从地图数据库抽取道路信息,划分高速公路、国道、省道、普通道路并附加对应行驶速度限速字段,形成路网地理数据文件;
第二步:轨迹数据清洗:抽取所述货运车辆轨迹数据库中每个轨迹数据,依次以单个货车轨迹数据为单位根据预设准则进行数据清洗;
第三步:切分货运行程:抽取经过数据清洗的货运车辆轨迹数据库中每个轨迹数据,筛选有效货运行程定位点并初步划分货运行程序号,结合该货车当日货运特征确定货运行程终止合理时间阈值以聚合初步货运行程序号,形成货运行程信息并加入运程数据库;
第四步:完成地图匹配及定位修复:抽取所述运程数据库中的每条运程数据,按照起、终点指示的索引号抽取对应车辆定位数据;根据轨迹定位点与候选道路间垂线距离、角度差异及速度差异,寻找每个所述定位数据对应的最佳道路段,将原始定位修复至最佳对应道路垂点并记录对应最佳道路段序号、名称、道路等级及道路宽度信息,并将添加信息后的定位数据以运程为单位添加入匹配数据库;
第五步:使用多源数据及地理信息软件验证货运行程切分效果:对于货运行程起、终点及全程定位均在分析省内的运程,采用货运调查数据起、终点均在对应分析省内的运距同切分货运行程运距分布特征进行比对,评价货运行程大体切分效果;
对于货运行程起、终点任意一点或全部处于分析省外的货运行程,采用地理信息软件分析其当日货运轨迹并与切分货运行程结果进行比对,评价货运行程大体切分效果;
第六步:分析道路使用情况并确定重点道路段及其挖掘时段:在给定道路等级的前提下,抽取所述路网地理数据文件中对应道路数据;以道路唯一识别号为连接字段汇总所述匹配数据库中对应出现在该路段的货车个数,确定挖掘道路段;统计并分析不同小时出现在所述道路段的货车个数,确定挖掘时段;
第七步:确定待分析轨迹库及其对应时间信息库与车辆信息库,修复异常定位时间:从所述匹配数据库和所述运程数据库中,抽取所述挖掘时段内通过目标挖掘道路段的运程信息及其对应定位数据,加入待分析轨迹库;
迭代所述待分析轨迹库内定位数据集的起、终点时间以确定自发编队搜索时间范围,按照货运定位装置更新时间及频率划分分析时间戳,结合时间戳唯一识别代码共同加入时间信息库;迭代所述待分析轨迹库内定位数据以修复异常时间值,同时将对应车辆唯一识别字段结合从0开始的车辆唯一识别代码共同加入车辆信息库;
第八步:确定每一时刻下的编队车辆集合,加入编队特征库:迭代所述时间信息库中时间戳信息,由所述待分析轨迹库抽取当前时间戳下存在定位信息的全部货车定位数据,逐时间戳按照编队车辆集合特征要求,使用P-OPTICS算法挖掘体现编队特征的全部车辆集合,并将涉及到的所述车辆唯一识别代码、时间戳唯一识别代码、车辆所属编队集合代号、车辆当前时间戳下经纬度信息加入编队特征库;
第九步:挖掘货车自发编队模式:抽取所述编队特征库中全部时间戳下的车辆自发编队信息,采用改进后的时、空二维闭频繁挖掘算法,综合使用Apriori剪枝、闭频繁挖掘算法,寻找体现自发编队特征时间最长的最大货车集合,以完成自发编队模式挖掘任务;
第十步:检验自发编队模式挖掘效果:评估目标挖掘道路在分析时段内货车自发编队行驶规模。


2.如权利要求1所述的一种基于货运轨迹数据的车辆自发编队模式挖掘方法,其特征在于,所述第一步中:所述识别信息包括:定位记录序号和车辆序号;
所述定位信息包括:车辆终端定位时间、定位经度及定位纬度;
所述驾驶信息包括:定位仪速度和行驶方向。


3.如权利要求1所述的一种基于货运轨迹数据的车辆自发编队模式挖掘方法,其特征在于,所述第一步中:所述路网地理数据文件为shp格式的地理数据文件,包括:路段信息、分类信息和限速信息;
其中,所述路段信息包括:路段唯一识别号码和路段名称;
所述分类信息为对于每一道路段,标注其道路等级;
所述限速信息为对于每一道路段,标注其最低限速与最高限速。


4.如权利要求1所述的一种基于货运轨迹数据的车辆自发编队模式挖掘方法,其特征在于,所述第二步包括:根据预设准则剔除不满足完整性的定位记录,修复不满足单一性的定位记录,删除定位记录存在不满足准确性的对应货车整个轨迹数据;
所述预设准则为:
完整性:轨迹数据中的定位记录需完整包含定位时间、经度及纬度字段,未满足此要求时删除对应定位记录;
单一性:轨迹数据删除同一时间下的重复定位记录;
准确性:当轨迹数据中任意两个GPS点间使用定位坐标及时间差异的计算位移速度,超过预设阈值时,删除对应定位记录所在的整个轨迹数据。


5.如权利要求1所述的一种基于货运轨迹数据的车辆自发编队模式挖掘方法,其特征在于,所述第三步中,筛选有效货运行程定位点并初步划分货运行程序号,包括:
S31、从轨迹数据第一条定位记录开始,设置当前货运行程序号为1,当出现速度为0的定位记录且从该记录开始后续序号连续的定位仪速度为0的定位记录持续时间超过预设分钟时,假设满足上述条件的最后一个定位仪速度为0的定位记录序号为n,则认为当前货运行程中断,轨迹数据中定位记录序号为1至定位记录序号为n的原始轨迹数据,其中速度为0的定位记录的停止标记为1,速度不为0的定位记录的停止标记为0;
S32、货运行程序号自增1,在未迭代至轨迹数据集最后一条数据时,从定位记录序号为n+1的定位记录处重复S31步骤操作;
S33、重复S32步骤迭代过程,直到迭代至轨迹数据最后一条定位记录时停止;
S34、删除轨迹数据集中停止标记为1的定位数据,剩余轨迹数据即为车辆有效货运行程定位点。


6.如权利要求5所述的一种基于货运轨迹数据的车辆自发编队模式挖掘方法,其特征在于,所述第三步中,结合该货车当日货运特征确定货运行程终止合理时间阈值以聚合初步货运行程序号,包括:
若货车当日运程起、终点均在省内且中途定位均在省内时,货运行程终止合理时间阈值设置为X分钟,即车辆有效货运行程定位点中前后两个货运行程序号结束与开始时间差低于X分钟时,应将两个货运行程予以聚合,并将两个原始货运行程序号对应定位记录的货运行程序号予以更新;对于车辆有效货运行程定位点,应从货运行程序号1开始迭代判断,直到更新至最后一个货运行程序号对应的定位记录;
当货车当日存在运程起、终点中任意一点或全部位于省外时,货运行程终止合理时间阈值设置为Y分钟,其聚合方式与上述当日运程起、终点均在省内且中途定位均在省内时的车辆有效货运行程定位点相同。


7.如权利要求6所述的一种基于货运轨迹数据的车辆自发编队模式挖掘方法,其特征在于,所述第三步中,形成货运行程信息并加入运程数据库,包括:
将聚合后的车辆有效货运行程定位点,迭代抽取货运行程序号对应的定位记录,根据首末定位记录确定当前货运行程的起止时间、货运行程总时间及对应的原始轨迹数据定位记录序号,根据定位记录间坐标推算的距离之和作为总运距、结合货运行程总时间得到货运行程平均速度;
汇总上述货运行程特征数据,得到对应货车的当日货运行程,加入至运程数据库。


8.如权利要求1所述的一种基于货运轨迹数据的车辆自发编队模式挖掘方法,其特征在于,第四步所述的地图匹配及定位修复过程,需综合考虑轨迹定位点与候选道路间垂线距离、角度差异及速度差异,其具体要求为:
距离标准:定位点与其最佳对应道路间垂线距离在最佳对应道路为普通公路时不高于50米、最佳对应道路为高速公路时不高于75米;
角度标准:定位点与最佳对应道路间角度绝对值差异不高于30度;
速度标准:定位点速度高于最佳对应道路最低限速;
针对运程数据库中每个运程对应的定位数据,对于定位数据中每个定位记录,其判断过程为:
判断方法1:若定位点与候选道路同时满足上述三条标准,则该候选道路为定位点的最佳匹配道路;
判断方法...

【专利技术属性】
技术研发人员:马晓磊霍恩泽李宏海
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1