一种通勤线路挖掘方法及装置制造方法及图纸

技术编号:16501089 阅读:25 留言:0更新日期:2017-11-04 11:47
本公开涉及一种通勤线路挖掘方法及装置。所述方法包括:获取多个出行人员的乘车数据;所述乘车数据中出行人员的上车地点与下车地点;利用聚类算法对所述乘车数据进行聚类以获取至少一个上车区域与至少一个下车区域、以及所述至少一个上车区域与所述至少一个下车区域之间所形成的多条通勤线路;根据预设通勤线路表从所述多条最优通勤线路中删除已经正在运营的通勤线路,则剩余的后选通勤线路是最终挖掘出的最优通勤线路;所述通勤线路是指从上车区域指向下车区域的出行路线。本公开实施例提供的装置基于上述方法实现。本公开实施例能够为出行人员提供便利、舒适与快捷的出行方案,提升出行人员体验。

Method and device for mining commuter line

The present invention relates to a method and device for mining commuter lines. The method comprises: obtaining a plurality of data bus travel personnel; personnel travel the data bus locations on the bus and get off at the bus; clustering of data to obtain at least one car area and at least a drop off area, and the at least one car area and the at least one get off a region in which a plurality of commuter routes using clustering algorithm; according to the preset table to delete the commuter lines of commuter routes has is operating from the multiple optimal commuter lines, is the most excellent commuter routes dig out the final selection of commuter routes remaining; the commuter line refers to the car to get off the regional area travel routes. The device provided by the disclosed embodiment is implemented based on the above method. The opening example can provide convenient, comfortable and fast travel plan for travel personnel, and improve the travel personnel experience.

【技术实现步骤摘要】
一种通勤线路挖掘方法及装置
本公开涉及计算机处理
,具体涉及一种通勤线路挖掘方法及装置。
技术介绍
随着经济的发展,人员流动也越来越频繁。在某一时间段内,从地点A到地点B人员比较相对比较大。并且从地点A到地点B的公共交通(例如公交、地铁、出租车等)由于价格太贵导致出行成本增加,或者人员过多导致出行体验太差,不能得到很好的出行体验。现有技术中,公共交通公司或者一些企业则组织有经验的员工在地点A与地点B之间设置通勤线路,虽然一定程度上缓解了出行人员的出行体验,但是由人工规划的通勤线路效率比较低,仍然不能满足出行人员的需求。
技术实现思路
针对现有技术中的缺陷,本公开提供一种通勤线路挖掘方法及装置,可以解决现有技术中根据经验人工规划通勤线路效率比较低且不能满足出行人员需求的问题。第一方面,本公开提供了一种通勤线路挖掘方法,所述方法包括:获取多个出行人员的乘车数据;所述乘车数据中出行人员的上车地点与下车地点;利用聚类算法对所述乘车数据进行聚类以获取至少一个上车区域与至少一个下车区域、以及所述至少一个上车区域与所述至少一个下车区域之间所形成的多条通勤线路;根据预设通勤线路表从所述多条后选通勤线路中删除已经正在运营的通勤线路,则剩余的后选通勤线路是最终挖掘出的最优通勤线路;所述通勤线路是指从上车区域指向下车区域的出行路线。可选地,所述乘车数据包括出行人员的历史出行数据和/或出行人员的募集需求数据;所述历史出行数据是指在预设时间段内出行人员从一个地点到另一个地点之间往返次数达到预设频次的出行记录;所述募集需求数据是指出行人员期望的一个地点与另一个地点之间的通勤线路。可选地,当所述出行人员的历史出行数据包括顺风车、专车、快车和出租车的数据时,获取多条通勤线路的步骤之后,所述方法还包括按照优先权去重处理的步骤,其中优先级顺序为:募集需求>顺风车>专车、快车>出租车。可选地,利用聚类算法获取所述上车区域或者所述下车区域的步骤包括:获取所述乘车数据中出行人员的上车地点与下车地点的经纬度坐标;设置地理区域块的长度以合并经纬度坐标位于同一个地理区域块中的上车地点或者下车地点;当所述地理区域块内的上车地点或者下车地点的数量超过预设值时,则所述地理区域块为所获取的所述上车区域或者所述下车区域。可选地,当每个地理区域块采用第一预设长度的字符串表示时,所述利用聚类算法获取所述上车区域或者所述下车区域的步骤还包括:根据预设字符串表将所获取的上车地点与下车地点的经纬度坐标映射成所述第一预设长度的字符串。可选地,所述利用聚类算法获取所述上车区域或者所述下车区域的步骤还包括:获取具有相同第二预设长度的字符串的地理区域块以得到至少二个复合地理区域块;所述第二预设长度小于所述第一预设长度;若至少两个复合地理区域块具有重叠区域且所述重叠区域满足预设条件时,合并所述至少两个复合地理区域块,并将合并后的复合地理区域作为上车区域或者下车区域;所述预设条件是指,所述重叠区域中包含的上车地点或者下车地点的数量与至少两个复合地理区域块内包含的上车地点或者下车地点的数量的比例大于预设比例值。可选地,所述至少一个上车区域与所述至少一个下车区域之间所形成的多条通勤线路的步骤中包括:依次获取一个上车区域到其他上车区域或者下车区域之间的通勤线路以及所对应的权重值;选择权重值最大的通勤线路作为该上车区域的后选通勤线路。可选地,所述至少一个上车区域与所述至少一个下车区域之间所形成的多条通勤线路的步骤中还包括:依次合并两条后选通勤线路以获取合并后的后选通勤线路;当合并后的后选通勤线路对应的出行需求与合并之前两条后选通勤线路对应的出行需求的比例满足预设需求比例时,则允许所述两条后选通勤线路合并。第二方面,本公开实施例还提供了一种通勤线路挖掘装置,所述装置包括:乘车数据获取模块,用于获取多个出行人员的乘车数据;所述乘车数据中出行人员的上车地点与下车地点;聚类模块,用于利用聚类算法对所述乘车数据进行聚类以获取至少一个上车区域与至少一个下车区域、以及所述至少一个上车区域与所述至少一个下车区域之间所形成的多条通勤线路;通勤线路获取模块,用于根据预设通勤线路表从所述多条后选通勤线路中删除已经正在运营的通勤线路,则剩余的后选通勤线路是最终挖掘出的最优通勤线路;所述通勤线路是指从上车区域指向下车区域的出行路线。可选地,所述乘车数据获取模块获取的乘车数据包括出行人员的历史出行数据和/或出行人员的募集需求数据;所述历史出行数据是指在预设时间段内出行人员从一个地点到另一个地点之间往返次数达到预设频次的出行记录;所述募集需求数据是指出行人员期望的一个地点与另一个地点之间的通勤线路。可选地,所述装置还包括优先权处理模块,用于在所述出行人员的历史出行数据包括顺风车、专车、快车和出租车的数据时,按照优先权顺序去掉所述多条通勤线路中重复的通勤线路;其中优先级顺序为:募集需求>顺风车>专车、快车>出租车。可选地,所述聚类模块还用于执行以下步骤获取所述上车区域或者所述下车区域包括:获取所述乘车数据中出行人员的上车地点与下车地点的经纬度坐标;设置地理区域块的长度以合并经纬度坐标位于同一个地理区域块中的上车地点或者下车地点;当所述地理区域块内的上车地点或者下车地点的数量超过预设值时,则所述地理区域块为所获取的所述上车区域或者所述下车区域。可选地,当每个地理区域块采用第一预设长度的字符串表示时,所述聚类模块还用于执行以下步骤获取所述上车区域或者所述下车区域包括:根据预设字符串表将所获取的上车地点与下车地点的经纬度坐标映射成所述第一预设长度的字符串。可选地,所述聚类模块还执行以下步骤获取所述上车区域或者所述下车区域包括:获取具有相同第二预设长度的字符串的地理区域块以得到至少二个复合地理区域块;所述第二预设长度小于所述第一预设长度;若至少两个复合地理区域块具有重叠区域且所述重叠区域满足预设条件时,合并所述至少两个复合地理区域块,并将合并后的复合地理区域作为上车区域或者下车区域;所述预设条件是指,所述重叠区域中包含的上车地点或者下车地点的数量与至少两个复合地理区域块内包含的上车地点或者下车地点的数量的比例大于预设比例值。可选地,所述聚类模块通过执行以下步骤获取多条通勤线路包括:依次获取一个上车区域到其他上车区域或者下车区域之间的通勤线路以及所对应的权重值;选择权重值最大的通勤线路作为该上车区域的最优通勤线路。可选地,所述聚类模块还通过执行以下步骤获取多条通勤线路包括:依次合并两条后选通勤线路以获取合并后的后选通勤线路;当合并后的后选通勤线路对应的出行需求与合并之前两条后选通勤线路对应的出行需求的比例满足预设需求比例时,则允许所述两条后选通勤线路合并。由上述技术方案可知,本公开实施例通过获取多个出行人员的乘车数据,并采用聚类算法对上述乘车数据进行聚类以获得至少一个上车区域与至少一个下车区域,进而可得到位于上车区域与下车区域之间的多条通勤线路;然后将通勤线路中所包含的已经正在运营的通勤线路删除,从而得到最优通勤线路。本公开实施例通过采集带来历史的乘车数据可以获取出行人员的需求热度,从而为出行人员提供便利、舒适与快捷的出行方案,提升出行人员体验。附图说明本文档来自技高网...
一种通勤线路挖掘方法及装置

【技术保护点】
一种通勤线路挖掘方法,其特征在于,所述方法包括:获取多个出行人员的乘车数据;所述乘车数据中出行人员的上车地点与下车地点;利用聚类算法对所述乘车数据进行聚类以获取至少一个上车区域与至少一个下车区域、以及所述至少一个上车区域与所述至少一个下车区域之间所形成的多条通勤线路;根据预设通勤线路表从所述多条最优通勤线路中删除已经正在运营的通勤线路,则剩余的后选通勤线路是最终挖掘出的最优通勤线路;所述通勤线路是指从上车区域指向下车区域的出行路线。

【技术特征摘要】
1.一种通勤线路挖掘方法,其特征在于,所述方法包括:获取多个出行人员的乘车数据;所述乘车数据中出行人员的上车地点与下车地点;利用聚类算法对所述乘车数据进行聚类以获取至少一个上车区域与至少一个下车区域、以及所述至少一个上车区域与所述至少一个下车区域之间所形成的多条通勤线路;根据预设通勤线路表从所述多条最优通勤线路中删除已经正在运营的通勤线路,则剩余的后选通勤线路是最终挖掘出的最优通勤线路;所述通勤线路是指从上车区域指向下车区域的出行路线。2.根据权利要求1所述的通勤线路挖掘方法,其特征在于,所述乘车数据包括出行人员的历史出行数据和/或出行人员的募集需求数据;所述历史出行数据是指在预设时间段内出行人员从一个地点到另一个地点之间往返次数达到预设频次的出行记录;所述募集需求数据是指出行人员期望的一个地点与另一个地点之间的通勤线路。3.根据权利要求2所述的通勤线路挖掘方法,其特征在于,当所述出行人员的历史出行数据包括顺风车、专车、快车和出租车的数据时,获取多条通勤线路的步骤之后,所述方法还包括按照优先权去重处理的步骤,其中优先级顺序为:募集需求>顺风车>专车、快车>出租车。4.根据权利要求1所述的通勤线路挖掘方法,其特征在于,利用聚类算法获取所述上车区域或者所述下车区域的步骤包括:获取所述乘车数据中出行人员的上车地点与下车地点的经纬度坐标;设置地理区域块的长度以合并经纬度坐标位于同一个地理区域块中的上车地点或者下车地点;当所述地理区域块内的上车地点或者下车地点的数量超过预设值时,则所述地理区域块为所获取的所述上车区域或者所述下车区域。5.根据权利要求4所述的通勤线路挖掘方法,其特征在于,当每个地理区域块采用第一预设长度的字符串表示时,所述利用聚类算法获取所述上车区域或者所述下车区域的步骤还包括:根据预设字符串表将所获取的上车地点与下车地点的经纬度坐标映射成所述第一预设长度的字符串。6.根据权利要求5所述的通勤线路挖掘方法,其特征在于,所述利用聚类算法获取所述上车区域或者所述下车区域的步骤还包括:获取具有相同第二预设长度的字符串的地理区域块以得到至少二个复合地理区域块;所述第二预设长度小于所述第一预设长度;若至少两个复合地理区域块具有重叠区域且所述重叠区域满足预设条件时,合并所述至少两个复合地理区域块,并将合并后的复合地理区域块作为上车区域或者下车区域;所述预设条件是指,所述重叠区域中包含的上车地点或者下车地点的数量与至少两个复合地理区域块内包含的上车地点或者下车地点的数量的比例大于预设比例值。7.根据权利要求1所述的通勤线路挖掘方法,其特征在于,所述至少一个上车区域与所述至少一个下车区域之间所形成的多条通勤线路的步骤中包括:依次获取一个上车区域到其他上车区域或者下车区域之间的通勤线路以及所对应的权重值;选择权重值最大的通勤线路作为该上车区域的后选通勤线路。8.根据权利要求7所述的通勤线路挖掘方法,其特征在于,所述至少一个上车区域与所述至少一个下车区域之间所形成的多条通勤线路的步骤中还包括:依次合并两条后选通勤线路以获取合并后的后选通勤线路;当合并后的后选通勤线路对应的出行需求与合并之前两条后选通勤线路对应的出行需求的比例满足预设需求比例时,则允许所述两条后选通勤线路合并。9.一种通勤线路挖掘装置,其特征在于,所...

【专利技术属性】
技术研发人员:石辕薛永刚王柱石
申请(专利权)人:滴滴中国科技有限公司
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1