路口控制策略的确定方法及装置、处理器以及电子设备制造方法及图纸

技术编号:37257816 阅读:14 留言:0更新日期:2023-04-20 23:33
本申请提供了一种路口控制策略的确定方法及装置、处理器以及电子设备,通过获取目标路口预设时间段内的交通数据,其中,交通数据至少包括目标路口的通行数据以及路口流量数据;控制交通数据输入至目标值网络,以得到目标值网络输出路口对应的目标控制策略,其中,目标控制策略至少包括目标路口的交通信号灯的控制动作,目标值网络为目标路口设置的目标智能单体对应的值网络,解决了现有技术中井下路口交通信号灯主要通过人工手动控制,导致交通信号灯规则在面对灵活多变的井下运输情况时过于死板、僵硬的问题。僵硬的问题。僵硬的问题。

【技术实现步骤摘要】
路口控制策略的确定方法及装置、处理器以及电子设备


[0001]本申请涉及井下煤矿运输领域,具体而言,涉及一种路口控制策略的确定方法及装置、处理器以及电子设备。

技术介绍

[0002]相关技术中,在煤矿传统井下运输的过程中,煤矿道路复杂且多变,在每日的运输作业调度中,要求道路尽可能通畅,确保每项运输任务都可以畅通无阻进行,按时完成,保障工作的进行。
[0003]针对井下煤矿运输系统中信号灯控制系统中繁多且复杂的井下运输道路,在每日的运输作业调度中,信号灯调度规则要求尽可能满足运输过程中的道路通畅,确保每项运输任务都可以畅通无阻,但是现有的信号灯控制逻辑采用固定的放行和停等策略,不会随着任务的变化而变化,随着任务的增多与多变,越来越难以满足需求这一痛点。传统的井下路口交通灯控制逻辑采用固定的放行和停等策略,这样会降低道路资源的使用效率。降低井下煤矿物料或作业工人运输车辆的运行效率,造成不必要的时间浪费、影响既有运输计划的实施、提高井下运输的成本。

技术实现思路

[0004]本申请的主要目的在于提供一种路口控制策略的确定方法及装置、处理器以及电子设备,以解决现有技术中井下路口交通信号灯主要通过人工手动控制,导致交通信号灯规则在面对灵活多变的井下运输情况时过于死板、僵硬的问题。
[0005]根据本专利技术实施例的一个方面,提供了一种路口控制策略的确定方法,预设交通区域包括有多个路口,每个路口处设置有一个智能单体,每个智能单体对应有一个值网络,该方法包括:获取目标路口预设时间段内的交通数据,其中,交通数据至少包括目标路口的通行数据以及路口流量数据;控制交通数据输入至目标值网络,以得到目标值网络输出路口对应的目标控制策略,其中,目标控制策略至少包括目标路口的交通信号灯的控制动作,目标值网络为目标路口设置的目标智能单体对应的值网络。
[0006]进一步地,在控制交通数据输入至目标值网络,并控制目标值网络输出路口对应的目标控制策略之前,该方法包括:确定用于训练目标值网络对应的多个训练样本;控制多个训练样本输入至目标值网络,并得到目标值网络输出多个控制策略;确定多个控制策略对应的多个价值,并确定多个价值中的最大价值,将最大价值对应的控制策略确定为目标值网络的目标输出值;控制目标输出值反馈至目标值网络,并依据目标输出值更新目标值网络。
[0007]进一步地,确定用于训练目标值网络对应的多个训练样本,包括:确定预设交通区域包括的多个路口,并确定多个路口对应的多个智能单体;确定多个智能单体对应的多个值网络,控制多个值网络构成混合网络;依据混合网络,确定多个训练样本。
[0008]进一步地,依据混合网络,确定多个训练样本,包括:确定目标智能单体在历史时
间段内接收的目标交通数据;确定其余多个智能单体在历史时间段内接收的多组交通数据,其中,其余多个智能单体为混合网络中除目标智能单体外的所有智能单体;确定目标交通数据与多组交通数据之间对应的多个互信息;依据目标交通数据以及多个互信息,确定训练样本。
[0009]进一步地,确定目标交通数据与多组交通数据之间对应的多个互信息,包括:确定目标交通数据,以及多组交通数据;确定预设损失函数;获取循环神经网络;通过预设损失函数更新循环神经网络,以得到目标循环神经网络;控制目标交通数据以及多组交通数据输入至目标循环神经网络,以得到多个互信息。
[0010]进一步地,通过预设公式表示互信息,预设公式为:其中,I(X;Y)为目标交通数据与第一交通数据之间的互信息,第一交通数据为多组交通数据中的任意一组交通数据,p(x,y)为目标交通数据与第一交通数据之间的联合分布,p(x)为目标交通数据对应的边缘分布,p(y)为第一交通数据对应的边缘分布。
[0011]根据本专利技术实施例的另一方面,还提供了一种路口控制策略的确定装置,预设交通区域包括有多个路口,每个路口处设置有一个智能单体,每个智能单体对应有一个值网络,该装置包括:第一获取单元,用于获取目标路口预设时间段内的交通数据,其中,交通数据至少包括目标路口的通行数据以及路口流量数据;第一控制单元,用于控制交通数据输入至目标值网络,以得到目标值网络输出路口对应的目标控制策略,其中,目标控制策略至少包括目标路口的交通信号灯的控制动作,目标值网络为目标路口设置的目标智能单体对应的值网络。
[0012]根据本专利技术实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的程序,其中,程序执行一种路口控制策略的确定方法。
[0013]根据本专利技术实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行一种路口控制策略的确定方法。
[0014]根据本专利技术实施例的另一方面,还提供了一种电子设备,包括:一个或多个处理器,存储器以及一个或多个程序,其中,一个或多个程序被存储在存储器中,并且被配置为由一个或多个处理器执行,一个或多个程序包括用于执行一种路口控制策略的确定方法。
[0015]在本专利技术实施例中,通过获取目标路口预设时间段内的交通数据,其中,交通数据至少包括目标路口的通行数据以及路口流量数据;控制交通数据输入至目标值网络,以得到目标值网络输出路口对应的目标控制策略,其中,目标控制策略至少包括目标路口的交通信号灯的控制动作,目标值网络为目标路口设置的目标智能单体对应的值网络,解决了现有技术中井下路口交通信号灯主要通过人工手动控制,导致交通信号灯规则在面对灵活多变的井下运输情况时过于死板、僵硬的问题,进而达到了提高了井下路口的控制效率的技术效果。
附图说明
[0016]构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0017]图1是根据本申请实施例提供的一种路口控制策略的确定方法的流程图;以及
[0018]图2示出了多智能体值分解网络算法的基础VDN网络框架的示意图;
[0019]图3是根据本申请实施例提供的一种路口控制策略的确定装置的示意图。
具体实施方式
[0020]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0021]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
[0022]需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种路口控制策略的确定方法,其特征在于,预设交通区域包括有多个路口,每个所述路口处设置有一个智能单体,每个所述智能单体对应有一个值网络,所述方法包括:获取目标路口预设时间段内的交通数据,其中,所述交通数据至少包括所述目标路口的通行数据以及路口流量数据;控制所述交通数据输入至目标值网络,以得到所述目标值网络输出所述路口对应的目标控制策略,其中,所述目标控制策略至少包括所述目标路口的交通信号灯的控制动作,所述目标值网络为所述目标路口设置的目标智能单体对应的所述值网络。2.根据权利要求1所述的方法,其特征在于,在控制所述交通数据输入至目标值网络,并控制所述目标值网络输出所述路口对应的目标控制策略之前,所述方法包括:确定用于训练所述目标值网络对应的多个训练样本;控制多个所述训练样本输入至所述目标值网络,并得到所述目标值网络输出多个控制策略;确定多个所述控制策略对应的多个价值,并确定多个所述价值中的最大价值,将所述最大价值对应的所述控制策略确定为所述目标值网络的目标输出值;控制所述目标输出值反馈至所述目标值网络,并依据所述目标输出值更新所述目标值网络。3.根据权利要求2所述的方法,其特征在于,确定用于训练所述目标值网络对应的多个训练样本,包括:确定所述预设交通区域包括的多个所述路口,并确定多个所述路口对应的多个智能单体;确定多个所述智能单体对应的多个所述值网络,控制多个所述值网络构成混合网络;依据所述混合网络,确定多个所述训练样本。4.根据权利要求3所述的方法,其特征在于,依据所述混合网络,确定多个所述训练样本,包括:确定所述目标智能单体在历史时间段内接收的目标交通数据;确定其余多个所述智能单体在所述历史时间段内接收的多组交通数据,其中,其余多个所述智能单体为所述混合网络中除所述目标智能单体外的所有所述智能单体;确定所述目标交通数据与多组所述交通数据之间对应的多个互信息;依据所述目标交通数据以及多个所述互信息,确定所述训练样本。5.根据权利要求4所述的方法,其特征在于,确定所述目标交通数据与...

【专利技术属性】
技术研发人员:陈湘源杨聪明高启业解鑫杨进胡比洋袁晓敏李建永石珂李星
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1