一种高收入出租车司机及其经验轨迹的提取方法、设备及存储介质技术

技术编号:29221374 阅读:31 留言:0更新日期:2021-07-10 01:01
本发明专利技术涉及一种高收入出租车司机及其经验轨迹的提取方法、设备及存储介质,本发明专利技术基于出租车轨迹数据,按时段和载客状态将轨迹数据进行划分,通过计算行驶里程、时间、收入等对出租车司机收入进行初步判断,进一步的,根据拥堵区域的分布使用轨迹样条法对司机类型进行二次判断,使用基于交叉口坐标的轨迹插值法快速恢复筛选到的高收入司机的相应轨迹,将提取到的行驶轨迹路线作为样本集,通过空间网格化分析,映射到轨迹分布直方图中,形成轨迹分布的图像表达方式。布的图像表达方式。布的图像表达方式。

【技术实现步骤摘要】
一种高收入出租车司机及其经验轨迹的提取方法、设备及存储介质


[0001]本专利技术涉及一种高收入出租车司机及其经验轨迹的提取方法、设备及存储介质,属于导航系统


技术介绍

[0002]随着城市交通的发展,通勤高峰时段路段的拥堵指数在不断增长。出租车作为城市公共交通的重要组成部分,在高峰时段发挥着重要的服务功能。但由于不同区域发生的拥堵,致使其调度功能受限,居民在高峰时段出行往往会遇到“打车难”或“无车打”的问题。而高收入出租车司机却能在高峰时段通过自己的驾驶经验,制定合适的驾驶策略,对拥堵区域作出绕行并挖掘高价值的载客点,降低了高峰时段的运营成本,提高了出租车的服务水平。研究人员意识到,可以通过安装在出租车内车载GPS定位终端所采集到出租车当日大量的轨迹点信息,包括轨迹点的经纬度、定位时间、载客状态等,挖掘高收入和经验丰富司机的轨迹数据,分析其驾驶经验路线和区域为其他司机的行驶策略提供指导以提高司机收入。但在采集过程中,由于设备技术问题、建筑物遮挡和电磁干扰等,造成了部分路段轨迹信息点的缺失和稀疏,导致轨迹的空间特征不足,同时,轨迹数据本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种高收入出租车司机及其经验轨迹的提取方法,其特征在于,包括以下步骤:步骤S1:出租车轨迹点数据预处理;步骤S2:按时段和载客状态对步骤S1预处理后的出租车轨迹点数据进行划分;步骤S3:对各出租车司机的经验系数进行计算;步骤S4:对高峰时段的数据进行聚类,得到拥堵区域的分布情况,使用轨迹样条法对各出租车司机的轨迹自由度进行计算;步骤S5:将经验系数和轨迹自由度高者组成高收入出租车数据集合,通过交叉口坐标点插值法恢复轨迹;步骤S6:对地图进行网格分割,计算每个网格内各车辆轨迹点的平均占比,映射到轨迹分布直方图中,形成轨迹分布的图像表达方式。2.根据权利要求1所述的一种高收入出租车司机及其经验轨迹的提取方法,其特征在于,步骤S1中,是指:统计当日整个城市各出租车提供的出租车轨迹点的数量,确定出租车轨迹点的分布情况,剔除分析区域范围外的和出租车轨迹点的数量小于800的出租车轨迹点,剩余出租车轨迹点集用V
data
表示,data表示出租车轨迹点的采集日期。3.根据权利要求2所述的一种高收入出租车司机及其经验轨迹的提取方法,其特征在于,步骤S2中,是指:选取早高峰时段,对V
data
进行第一次划分,分成早高峰时段的出租车轨迹点集V
data,peak
和非早高峰时段的出租车轨迹点集即其他时段的出租车轨迹点集V
data,low
,peak和low分别表示高峰和其他时段;对V
data,peak
和V
data,low
分别按车牌号和载客状态进行二次划分,先从V
data,peak
和V
data,low
中根据车牌号提取到每辆出租车对应的出租车轨迹点集v
data,peak,car_no
和v
data,low,car_no
,car_no表示出租车的车辆编号;接着,对出租车轨迹点集v
data,peak,car_no
和v
data,low,car_np
根据载客状态进行划分,每个轨迹点集划分为若干个载客和空载的子轨迹,即v
data,peak,car_no
={traj
1,status
,traj
2,status

traj
i,status
},v
data,low,car_no
={traj
1,status
,traj
2,status

traj
j,status
},status表示载客状态,status=0表示空载,status=1表示载客;traj表示一段轨迹,由轨迹点组成,traj={p
1,stat#s
,p
2,stat#s

p
n,stat#s
},p
1,stat#s
,p
2,stat#s
表示轨迹点,对于每辆出租车,得空载轨迹n段,载客轨迹m段。4.根据权利要求1所述的一种高收入出租车司机及其经验轨迹的提取方法,其特征在于,步骤S3中,计算每辆出租车不同轨迹段的行驶里程、载客时间和空载时间,得到每辆车的经验系数E
car_no
,具体步骤为:步骤S3

1:根据车辆全天的轨迹数据和载客状态,计算出租车司机全天的空载里程d
empty,car_no
和载客里程d
pass,car_no
;通过式(1)求取两个出租车轨迹点p
i
与p
i+1
之间的纬度之差;通过式(2)求取两个出租车轨迹点p
i
与p
i+1
之间的经度之差;通过式(3)求取两个出租车轨迹点p
i
与p
i+1
之间的距离;通过式(4)求取两个出租车轨迹点p
i
与p
i+1
之间的距离;dlat=lat
i+1

lat
i
ꢀꢀꢀ
(1)dlon=lon
i+1

lon
i
ꢀꢀꢀ
(2)
式(1)、式(2)中,dlat表示两个出租车轨迹点间的纬度之差;dlon表示两个出租车轨迹点间经度之差;p
i
(lon
i
,lat
i
)即p
i
表示当前的出租车轨迹点,p
i+1
(lon
i+1
,lat
i+1
)即p
i+1
表示与p
i
邻接的下一个出租车轨迹点,lat
i
与lat
i+1
分别表示两个出租车轨迹点p
i
与p
i+1
的纬度,lon
i
与lon
i+1
分别表示两个出租车轨迹点p
i
与p
i+1
的经度;i+1表示当前轨迹中出租车轨迹点的数目;式(3)、式(4)中,d(p
i
,p
i+1
)表示出租车轨迹点p
i
与p
i+1
之间的距离,表示轨迹traj的长度,轨迹中共有i+1个轨迹点;则对于每个司机,其全天的空载里程d
eRpty,car_no
和载客里程d
pass,car_no
分别如式(5)、式(6)所示:(6)所示:式(5)、式(6)中,表示每段空载轨迹的长度,由i+1个轨迹点构成,共n段,每段status=0;表示每段载客轨迹的长度,由i+1个轨迹点构成,共m段,此时status=1;步骤S3

2:根据步骤S3

1计算的轨迹的长度d,d为空载里程d
empty,car_no
和载客里程d
pass,car_no
之和,进一步得出出租车司机每段载客轨迹的收入,计算公式如式(7)所示:式(7)中,表示轨迹长度为d的收入,x
i
为0

1变量,当x
i
=0时,表示载客;当x
i
=1时,表示空载,R
start
表示出租车起步价,λ表示每公里的租价,表示加收的空驶费率,c表示其他支出,dist1,dist2,dist3表示当地物价局或运营公司设置的里程计费节点;则出租车载客时的收益R
car_no
的计算如式(8)所示:式(8)中,d
i
表示载客每段载客轨迹的长度,载客轨迹共有m段;步骤S3

3:计算出租车司机的经验系数E
car_no
,如式(9)、式(10)所示:t
traj
=t
end,i+1

t
start,1
ꢀꢀꢀ
(9)式(9)至式(10)中,t
traj
表示第j段轨迹出租车的行驶时长,t
start,1
表示当前轨迹中第一个轨迹点的生成时间,t
end,i+1
表示当前轨迹中最后一个轨迹点的生成时间;t
traj,data,car_no
表示该出租车在data日期内的总行驶时长;步骤S3

4:重复步骤S3

1、步骤S3

2、步骤S3

3,依次计算出各个出租车司机的经验系
数E
car_no
。5.根据权利要求3所述的一种高收入出租车司机及其经验轨迹的提取方法,其特征在于,步骤S4中,对步骤S2中所得的V
data,peak
进行两次聚类,具体步骤如下:步骤S4

1:通过DBSCAN算法对V
data,peak
进行初步聚类:读取高峰时段的所有出租车轨迹点的经纬度字段数据,输入ε、MinPts,ε表示半径参数,MinPts表示邻域集合中轨迹点的最小数目,遍历数据点,得到n个聚类簇Ci,i=1,2,3

n;步骤S4

2:通过K

Means算法计算步骤S4

1得到的每个聚类簇Ci的经纬度的聚类中心、每个聚类簇Ci的速度的聚类中心:每次聚类设定K值为1,多次迭代计算后,聚类中心不再发生变化,得到每个聚类簇Ci的经纬度的聚类中心c
i
及聚类簇Ci的对应的速度聚类中心v
i
,i=1,2

n;步骤S4

3:根据步骤S4

2得到的速度聚类中心v
i
,当x
i
<ξ时,判断该聚类簇Ci为拥堵区域,ξ表示高峰时段出租车速度阈值,否则,判断该聚类簇Ci为非拥堵区域;剔除非拥堵区域后,得到拥堵区域的中心坐标集合Cong,Cong={c
′1,c
′2…
c

m
},m≤n;步骤S4

4:使用轨迹样条法分析各出租车轨迹点和中心坐标集合Cong中元素的位置关系,将每一个v
data,peak,car_no
划分为m+1段,对于车牌编号为car_no的轨迹点数据集,划分步骤如下:将轨迹点集按时间排列,首个轨迹点为p1(lon1,lat1),最末轨迹点为p
i+1
(lon
i+1
,lat
i+1
),轨迹点数为i+1,得到每段中轨迹点的数量k,如式(11)所示:式(11)中,k表示每段中轨迹点的数量,并向下取整;则出租车每个轨迹点集划分为m+1段子轨迹集,即v
data,peak,car_no
={point
1,k
,point
k,2k

point
(m|1)k,mk
,point
mk,i+1
};point
1,k
表示排序后的v
data,peak,car_no
...

【专利技术属性】
技术研发人员:陈京荣兰晓伟吴建清吕斌侯文斌宋修广张昱吕琛庄绪彩
申请(专利权)人:山东大学苏州研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1