【技术实现步骤摘要】
一种基于广度优化算法的网约车订单分配系统
[0001]本专利技术涉及网约车订单分配领域,具体地说,涉及一种基于广度优化算法的网约车订单分配系统。
技术介绍
[0002]随着互联网技术的发展,尤其是移动互联网的迅速普及,让网约车平台成为了人们出行的重要方式之一。有出行需求时,用手机约车,方便快捷,但是目前来说乘客发出订单请求后,需要较长等待时间,而且有时司机距离远,没有匹配到最合适的司机。所以,如何提高订单分配的效率和准确性,已成为网约车平台需要面对的核心问题之一。传统的网约车订单分配过程主要采用的是贪心算法。这种算法虽然简单易行,但是它往往只考虑当前局部最优解,容易导致全局不优,导致资源浪费。同时,它无法解决实际情况中存在的多个客户需求满足的问题,也无法体现复杂的约束条件。所以提出一种广度优化算法的网约车平台派单系统,在满足约束条件的前提下,遍历所有可行解并找到最优解决方案。有效地解决复杂的订单分配问题,提高分配效率和准确性,降低成本和误差率。
技术实现思路
[0003]本专利技术的目的在于提供一种基于广度优化算法的网约车订单分配系统,以解决上述
技术介绍
中提出的问题。
[0004]为实现上述目的,提出了一种基于广度优化算法的网约车订单分配系统,包括订单发布模块、订单分配模块、策略评估模块;首先,对乘客发出的网约车订单请求根据区域划分,上传系统订单数据库,根据联合Q值强化学习算法,匹配出适合该网约车订单的空载网约车,其次,空载的网约车司机对系统匹配的网约车订单进行抢单,且网约车平台通过广度优化算 ...
【技术保护点】
【技术特征摘要】
1.一种基于广度优化算法的网约车订单分配系统,其特征在于,包括订单发布模块、订单分配模块、策略评估模块;首先,对乘客发出的网约车订单请求根据区域划分,上传系统订单数据库,根据联合Q值强化学习算法,匹配出适合该网约车订单的空载网约车,其次,空载的网约车司机对系统匹配的网约车订单进行抢单,且网约车平台通过广度优化算法,建立系统派单策略,将订单派给最合适的空载网约车,最后,网约车平台根据订单反馈,构建订单评价体系,优化系统的订单分配策略。2.根据权利要求1所述一种基于广度优化算法的网约车订单分配系统,其特征在于,所述订单发布模块,网约车平台根据自然地理边界进行划分,将不同位置的订单分类进入订单序列。3.根据权利要求1所述一种基于广度优化算法的网约车订单分配系统,其特征在于,所述订单发布模块,网约车平台将订单信息上传数据库。4.根据权利要求1所述一种基于广度优化算法的网约车订单分配系统,其特征在于,所述订单发布模块,通过联合Q值强化学习算法对网约车订单和网约车司机进行匹配,详细过程如下:将区域模型通过正方形网格进行划分,正方形的边代表道路,节点代表路网交叉点,定义道路上相应的成本,由天气、日期、环境因素决定;网约车司机完成订单获得奖励,网约车司机空载运动获得零奖励,构建要素函数G:N代表区域模型中的车辆数量,s代表状态集合,A代表联合动作空间,P代表状态转移概率,R代表奖励因子,代表折扣系数;t时刻状态表示为一个三元素元组,表示t时刻状态,l代表车辆位置,t代表时间,y表示网约车司机成功接单;定义t时刻动作,对行程进行分配,时刻,表示车辆位置在处,在时刻,司机未接单成功,时刻状态表示车辆位置在处,在时刻,司机接单成功;动作=(l,t),所有符合条件动作的空间用联合动作空间A表示;定义奖励函数:,分布表示各时间步长奖励的折扣系数,分布表示各时间步长的奖励;定义动作价值函数Q,公式如下:E代表期望,表示t时刻状态,表示t时刻联合动作空间,分别表示初始时刻状态和联合动作空间,T表示总时间步长;构建算法的策略,代表将状态映射到动作空间上的分布策略,学习型贪婪策略公式如下:,argmax代表找到令取最大值时参数的函数,网约车司机遵循策略,获得预期累计奖励,状态值函数为:,t时刻,区域最优联合动作为所有网约车最优动作集合,通过因式分解,联合动作价值函数:,分别代表总的状态和总的联合动作空间,联合动作价值函数公式如下:
是一个历史联合动作,有独立动作函数,、分别代表第i个和第N个动作价值函数,、分别代表第i个和第N个动作,、分别代表第i个和第N个状态,将由分解,确保上上argmax函数得到的联合动作a和上argmax函数得到的独立动作一致,每辆网约车的独立最优动作,是联合最优动作的一部分;针对独立动作价值网络,每辆车的独立动作价值网络根据自身输入,输出动作价值,对所有车辆动作值有如下...
【专利技术属性】
技术研发人员:请求不公布姓名,
申请(专利权)人:云南升玥信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。