当前位置: 首页 > 专利查询>滁州学院专利>正文

一种按需出行智能决策方法和系统技术方案

技术编号:34552114 阅读:24 留言:0更新日期:2022-08-17 12:37
本发明专利技术公开了一种按需出行智能决策方法和系统,其中方法包括S1,将大规模的序列订单分配过程建模为马尔可夫序列决策模型;S2,收集按需出行历史数据,进行供需预测;S3,进行马尔可夫序列决策模型训练;S4,进行供需动态平衡的智能调度。本发明专利技术通过地理格网将研究区的地理空间区域时空量化,从而更好地反映按需出行网约车司机的位置与状态及不同决策情况下供需分布情况,解决了网约车数据海量、离散、真实场景复杂、多变等问题。通过按需出行平台的历史订单数据,可寻找出任意位置和状态下的最大期望收益,进行实时动态规划,优化了按需出行平台大规模派单决策的效率,实现了乘客总满意度、按需出行平台与网约车司机总收益的最大化。化。化。

【技术实现步骤摘要】
一种按需出行智能决策方法和系统


[0001]本专利技术涉及智能交通领域,特别涉及一种按需出行智能决策方法和系统。

技术介绍

[0002]智能交通作为城市发展的核心动脉,一直是智慧城市建设的重点。随着互 联网技术的迅猛发展,按需出行必将成为未来智能交通的新形态。按需出行是 指人们无需拥有车辆所有权,并且通过共享或合乘的方式与其他人共享车辆的 出行方式。按需出行的出现弥补了传统出行方式的不足,使乘客可以享受到方 便快捷的周到服务,同时也能拉动社会闲散资源的运作,刺激城市经济的发展。
[0003]理想的按需出行市场应该是全职运力少有出现闲置的情况,出行需求能够 迅速得到满足,兼职运力能即时进入和退出市场,实现调节供需的作用。
[0004]实际的情况是全职运力经常出现闲置的情况,一些局部空间的出行需求不 能得到满足或者得不到迅速满足,兼职运力不能很好的调节供需。出现这些情 况现象的原因是一定空间范围内存在供需矛盾;一方面,在出行需求多的热区, 过多司机聚集导致恶性竞争和运力浪费,另一方面,在出行需求少的冷区,乘 客打不到车或者需要支付高本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种按需出行智能决策方法,其特征在于,包括以下步骤:S1,将大规模的序列订单分配过程建模为马尔可夫序列决策模型;S2,收集按需出行历史数据,进行供需预测;S3,根据所述供需预测,进行马尔可夫序列决策模型训练;S4,利用训练好的马尔可夫序列决策模型进行供需动态平衡的智能调度。2.根据权利要求1所述的按需出行智能决策方法,其特征在于:步骤1中所述马尔可夫序列决策模型的智能体、环境以及策略分别为网约车司机、整个按需出行市场以及选择某个订单的行动;所述马尔可夫序列决策模型包括状态空间、动作空间、奖励函数、以及状态转移函数;所述状态空间是指按需出行市场本身,是供给方网约车司机和需求方乘客的参与场所,采用地理格网进行离散化,将时间和地理空间的笛卡尔积表示为状态集合S,其中,按需出行的单个状态可表示为s=(t,g)∈S,t∈T是离散化的时间索引值,g∈G是离散化的空间索引值,因此,将研究区离散化为规则地理格网,单个地理格网即为一个状态;所述动作空间是指以智能体为中心,一定范围内可供选择的订单集合;在真实按需出行活动中,动作空间中动作数量有限明确的,表示为A={接单1,接单2,接单3,
……
};在历史出行数据中,A={接单},动作空间中只有一个接单动作,智能体通过挑选某个动作转移到下一个状态;所述奖励函数是指智能体通过挑选某个动作转移到下一个状态所获得的决策效益;在按需出行场景中,每个订单价值需要在出行完成后才可确定,所以需要预估价格,预估存在不确定性,需要折扣因子,即时奖励表达为式中是订单的预估价格;T
travel
为订单的预估到达时间;R为从订单开始t=0时刻到t时刻的实际价格,ζ为折扣因子;所述状态转移指智能体由t时刻的状态s转移到下一个时刻t+1的状态s

;所述状态转移是伴随着共享决策行为发生的,空闲司机的状态转移可表示为s=(t,g)

s'=(t+1,g),即决策时间t加1,地理位置区域g不变;分配了订单的出行司机的状态可表示为s=(t,g)

s'=(t+Δt,g
dest
),其中,Δt表示预估接驾时间与送达时间之和,g
dest
表示出行订单目标地点的索引。3.根据权利要求2所述的按需出行智能决策方法,其特征在于,步骤1中进行建模的步骤具体包括:S11,收集研究区的历史接单数据作为训练数据,并将研究区时空量化为规则地理格网,单个地理格网即为一个状态,明确训练数据的空间范围和单个格网大小,然后使用PostGIS的格网函数生成几何数据存储在PostGIS数据库中,并建立行列索引,创建状态价值字段;S12,明确智能体出行轨迹和状态转移序列,准备好智能体出行历史轨迹数据,明确单条轨迹终止条件,使用PostGIS空间查询函数建立格网表达的状态转移序列表;S13,明确状态转移的奖励函数,并计算相应的即时奖励值;S14,明确进行训练所用的算法的动作集,并明确学习策略,策略是给定状态到动作集
的概率分布。4.根据权利要求2所述的按需出行智能决策方法,其特征在于,步骤2中的所述供需预测的步骤包括:S21,收集按需出行的历史数据即历史供需点;S22,使用最短距离聚类法对历史数据进行聚类,然后提取聚类中心点;S23,对所述聚类中心点进行插值获取泰森多边形作为空间划分区域,并将泰森多边形映射到所述地理格网;S24,对每个所述泰森多边形进行线性回归,预测未来的供需情况。5.根据权利要求2所述的按需出行智能决策方法,其特征在于,所述步骤3 使用时序差分的时间差分学习算法对所述模型进行训练,所述时间差分学习算法具体包括:假设按需出行网约车司机订单序列是彼此独立的,那么对环境的探索就是一系列独立序列的随机实验,使用时序差分的时间差分学习算法,迭代计算每个地理格网的累计奖励值,直到小于给定阈值ξ收敛,计算方法如下,Δ=|α
·
(R(s)+γ
·
V(s')<...

【专利技术属性】
技术研发人员:孙勇刘宇鑫刘文镇乔莲花陈茂鑫
申请(专利权)人:滁州学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1