预估到达时间的方法及系统技术方案

技术编号:19779257 阅读:31 留言:0更新日期:2018-12-15 11:38
本公开实施例提供了一种预估到达时间的方法及系统,包括:获取不同场景中的各订单的行程轨迹数据;提取行程轨迹数据中的全局特征数据及序列特征数据,且全局特征数据为针对各订单中包含的信息进行提取的数据,序列特征数据为针对行程轨迹数据中的各路段进行提取的数据;将全局特征数据及序列特征数据分别进行处理,得到全局特征数据对应的全局信息及序列特征数据对应的序列信息;将全局信息及序列信息进行融合并预测到达时间。本公开实施例通过分别对订单和路段进行全局特征数据和序列特征数据的提取,使得在预估到达时间时其结果能够更加的准确。

【技术实现步骤摘要】
预估到达时间的方法及系统
本公开实施例涉及数据处理
,更具体而言,涉及一种预估到达时间的方法及一种预估到达时间的系统。
技术介绍
目前,在电子地图和导航领域,移动主体(车辆,行人等)在给定路线时,由起点到终点所要花费的时间是一个非常重要的技术指标,它描述了出行的相关代价和花费。对这一时间的估计叫做到达时间预估(EstimatedTimeofArrival,ETA)。相关技术中,在进行ETA的常用解决方案有两种:一种是对这一过程进行物理建模,计算每一段路程的速度,由此得到经过每条路段所需的时间,加上通过路口的时间代价,最终得到整体的时间,该方法解决方案基于GBDT(GradientBoostingDecisionTree,梯度提升决策树)模型,但是由于不同行程的link(道路)数目不一致,该方法只能针对整体路径提取整体的特征,无法单独针对每条link进行特征提取建模,限制了模型的性能;另一种是把ETA建模称为一个机器学习问题,把历史行程作为训练数据,以整个路径的统计特征等作为样本特征,以真实的行驶时间作为标签,学习得到回归模型,该方法解决方案基于RNN(RecurrentNeuralNetwork,回归神经网络),可以根据每条link的特征进行序列学习,不再局限于整体特征,但RNN的强项在于实数特征,而在稀疏特征的建模上需要改进。公开实施例内容本公开实施例旨在至少解决现有技术中存在的技术问题之一。本公开实施例的一个方面提供了一种预估到达时间的方法。本公开实施例的一个方面提供了一种预估到达时间的系统。本公开实施例的一个方面提供了一种计算机设备。本公开实施例的一个方面提供了一种计算机可读存储介质。鉴于上述,本公开实施例提供的一种预估到达时间的方法,预估到达时间的方法包括:获取不同场景中的各订单的行程轨迹数据;提取行程轨迹数据中的全局特征数据及序列特征数据,且全局特征数据为针对各订单中包含的信息进行提取的数据,序列特征数据为针对行程轨迹数据中的各路段进行提取的数据;将全局特征数据及序列特征数据分别进行处理,得到全局特征数据对应的全局信息及序列特征数据对应的序列信息;将全局信息及序列信息进行融合并预测到达时间。根据本公开实施例提供的预估到达时间的方法,首先获取不同场景中的各订单的行程轨迹数据,同时可以对提取的行程轨迹数据进行清洗、去除噪声,以提高数据的真实可信度;随后在行程轨迹数据中提取全局特征数据和序列特征数据,此时的全局特征数据为针对各订单中包含的信息进行提取的数据,将整个订单作为整体,提取能反应订单的特征数据,序列特征数据则为针对行程轨迹数据中的各路段进行提取的数据,序列特征数据会将行程轨迹数据中各个路段进行单独提取分析,使得各个路段中涉及的数据都能被分别标注提取出;随后将全局特征数据进行分析处理,以得到相对应的全局信息,同时对序列特征数据进行分析处理,以得到相对应的序列信息,全局信息和序列信息为分别通过一定的模型,对全局特征数据和序列特征数据进行学习和编码而得到的,最后将全局信息及序列信息进行信息融合,并且通过融合后的信息来预测到达时间,本公开实施例通过分别对订单和路段进行全局特征数据和序列特征数据的提取,使得在预估到达时间时其结果能够更加的准确。可以想到地,全局特征数据在反应订单中的信息时,可以针对订单本身涉及到的特征,也可以是针对发生订单时的外界的特征,如发生订单时的天气、时段、星期、订单起点和终端之间的距离等特征,而序列特征数据则针对各个路段的特征,如涉及的路段的名称、限速情况、路段长度、通信速度等。另外,根据本公开实施例提供的一种预估到达时间的方法还具有如下附加技术特征:在上述任一技术方案中,优选地,提取行程轨迹数据中的全局特征数据及序列特征数据的步骤具体包括:将行程轨迹数据按照订单维度及路段维度进行分类;在订单维度中统计各订单的第一离散特征及第一实数特征组成全局特征数据,且在路段维度中统计各路段的第二离散特征及第二实数特征组成序列特征数据;其中,第一离散特征包括至少一种描述订单的离散数据,第一实数特征包括至少一种描述订单的实数值数据,第二离散特征包括至少一种描述路段的离散名义数据,第二实数特征包括至少一种描述路段的实数值数据。在该技术方案中,在提取行程轨迹数据中的全局特征数据及序列特征数据时,首先会将行程轨迹数据按照订单维度和路段维度进行分类,并且在订单维度中,分别统计第一离散特征和第一实数特征,全局特征数据为由第一离散特征和第一实数特征共同组成,第一离散特征中包括至少一种描述订单的离散数据(稀疏数据),第一实数特征中包括至少一种描述订单的实数值数据,同时在路段维度中统计各路段的第二离散特征及第二实数特征,序列特征数据由第二离散特征及第二实数特征共同组成,第二离散特征包括至少一种描述路段的离散名义数据(稀疏数据),第二实数特征包括至少一种描述路段的实数值数据,使得在后续对全局特征数据及序列特征数据进行处理分析时,能保证对订单及路段都能获取到针对离散数据和实数连续数据两种类型的数据。在上述任一技术方案中,优选地,将全局特征及序列特征分别进行处理,得到全局特征对应的全局信息及序列特征对应的序列信息的步骤具体包括:将全局特征输入Wide模型及Deep模型分别进行学习,以得到全局信息;将序列特征输入RNN模型进行学习,以得到序列信息,其中序列信息包含RNN最终时刻的隐状态。在该技术方案中,在对全局信息进行处理时,分别对其输入到Wide模型及Deep模型分别进行学习,在输入至Wide模型时,将全局特征数据进行二阶交叉(两两相乘)并进行学习,同时用Deep模型基于深层神经网络对全局特征数据进行特征的抽象表示;并且RNN模块对序列特征数据进行学习:按照道路的顺序,将序列特征数据依次输入到RNN中。RNN提取序列的信息,将其编码在最后一个时刻的隐状态中。在本公开实施例中,一方面可以通过RNN单独针对每条道路进行特征提取建模,进行序列学习,进行序列特征的精细建模,不再局限于整体特征,大大提高了有效特征的范围。另一方面通过Wide模型和Deep模型提供对全局特征(尤其是稀疏特征)的良好建模,这样使得既可以处理道路的序列化特征,又可以对全局的稀疏特征有良好的建模。在上述任一技术方案中,优选地,将全局信息及序列信息进行融合并预测到达时间的步骤具体包括:将全局信息和序列信息合并至同一向量中,并将向量输入至神经网络模型,计算得到预测到达时间。在该技术方案中,在最终预测到达时间时,会将RNN最终的隐状态和Wide模型、Deep模型的对应输出合并成一个向量,然后输入到一个多层感知机(多层神经网络模型)中,在多层感知机中利用融合后的信息,预测到达时间。在上述任一技术方案中,优选地,第一离散特征包括以下任一或组合:天气、星期、接单司机、订单地域、下单时段;和/或第一实数特征包括以下任一或组合:订单路程、以订单起点和订单终点为对角线组成的矩形面积;和/或第二离散特征包括以下任一或组合:路段名称、路段编号、路段限速等级;和/或第二实数特征包括以下任一或组合:路段实时通行速度、路段长度、路段宽度。在该技术方案中,第一离散特征可以包括天气、星期、接单司机、订单地域、下单时段等任一数据或任意组合,对于在同一订单中,本文档来自技高网...

【技术保护点】
1.一种预估到达时间的方法,其特征在于,所述预估到达时间的方法包括:获取不同场景中的各订单的行程轨迹数据;提取所述行程轨迹数据中的全局特征数据及序列特征数据,且所述全局特征数据为针对所述各订单中包含的信息进行提取的数据,所述序列特征数据为针对所述行程轨迹数据中的各路段进行提取的数据;将所述全局特征数据及所述序列特征数据分别进行处理,得到所述全局特征数据对应的全局信息及所述序列特征数据对应的序列信息;将所述全局信息及所述序列信息进行融合并预测到达时间。

【技术特征摘要】
1.一种预估到达时间的方法,其特征在于,所述预估到达时间的方法包括:获取不同场景中的各订单的行程轨迹数据;提取所述行程轨迹数据中的全局特征数据及序列特征数据,且所述全局特征数据为针对所述各订单中包含的信息进行提取的数据,所述序列特征数据为针对所述行程轨迹数据中的各路段进行提取的数据;将所述全局特征数据及所述序列特征数据分别进行处理,得到所述全局特征数据对应的全局信息及所述序列特征数据对应的序列信息;将所述全局信息及所述序列信息进行融合并预测到达时间。2.根据权利要求1所述的预估到达时间的方法,其特征在于,所述提取所述行程轨迹数据中的全局特征数据及序列特征数据的步骤具体包括:将所述行程轨迹数据按照订单维度及路段维度进行分类;在所述订单维度中统计所述各订单的第一离散特征及第一实数特征组成所述全局特征数据,且在所述路段维度中统计所述各路段的第二离散特征及第二实数特征组成所述序列特征数据;其中,所述第一离散特征包括至少一种描述订单的离散数据,所述第一实数特征包括至少一种描述订单的实数值数据,所述第二离散特征包括至少一种描述路段的离散名义数据,所述第二实数特征包括至少一种描述路段的实数值数据。3.根据权利要求1或2所述的预估到达时间的方法,其特征在于,将所述全局特征及所述序列特征分别进行处理,得到所述全局特征对应的全局信息及所述序列特征对应的序列信息的步骤具体包括:将所述全局特征输入Wide模型及Deep模型分别进行学习,以得到所述全局信息;将所述序列特征输入RNN模型进行学习,以得到所述序列信息,其中所述序列信息包含RNN最终时刻的隐状态。4.根据权利要求3所述的预估到达时间的方法,其特征在于,将所述全局信息及所述序列信息进行融合并预测到达时间的步骤具体包括:将所述全局信息和所述序列信息合并至同一向量中,并将所述向量输入至神经网络模型,计算得到预测所述到达时间。5.根据权利要求2所述的预估到达时间的方法,其特征在于,所述第一离散特征包括以下任一或组合:天气、星期、接单司机、订单地域、下单时段;和/或所述第一实数特征包括以下任一或组合:订单路程、以订单起点和订单终点为对角线组成的矩形面积;和/或所述第二离散特征包括以下任一或组合:路段名称、路段编号、路段限速等级;和/或所述第二实数特征包括以下任一或组合:路段实时通行速度、路段长度、路段宽度。6.一种预估到达时间的系统,其特征在于,所述预估到达时间的系统包括:获取单元,用于获取不同场景中的各订单的行程轨迹数据;提取单元,用...

【专利技术属性】
技术研发人员:傅昆王征
申请(专利权)人:北京嘀嘀无限科技发展有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1