【技术实现步骤摘要】
路口控制策略的确定方法及装置、处理器以及电子设备
[0001]本申请涉及井下煤矿运输领域,具体而言,涉及一种路口控制策略的确定方法及装置、处理器以及电子设备。
技术介绍
[0002]相关技术中,在煤矿传统井下运输的过程中,煤矿道路复杂且多变,在每日的运输作业调度中,要求道路尽可能通畅,确保每项运输任务都可以畅通无阻进行,按时完成,保障工作的进行。
[0003]针对井下煤矿运输系统中信号灯控制系统中繁多且复杂的井下运输道路,在每日的运输作业调度中,信号灯调度规则要求尽可能满足运输过程中的道路通畅,确保每项运输任务都可以畅通无阻,但是现有的信号灯控制逻辑采用固定的放行和停等策略,不会随着任务的变化而变化,随着任务的增多与多变,越来越难以满足需求这一痛点。传统的井下路口交通灯控制逻辑采用固定的放行和停等策略,这样会降低道路资源的使用效率。降低井下煤矿物料或作业工人运输车辆的运行效率,造成不必要的时间浪费、影响既有运输计划的实施、提高井下运输的成本。
技术实现思路
[0004]本申请的主要目的在于提供一种路口 ...
【技术保护点】
【技术特征摘要】
1.一种路口控制策略的确定方法,其特征在于,预设交通区域包括有多个路口,每个所述路口处设置有一个智能单体,每个所述智能单体对应有一个值网络,所述方法包括:获取目标路口预设时间段内的交通数据,其中,所述交通数据至少包括所述目标路口的通行数据以及路口流量数据;控制所述交通数据输入至目标值网络,以得到所述目标值网络输出所述路口对应的目标控制策略,其中,所述目标控制策略至少包括所述目标路口的交通信号灯的控制动作,所述目标值网络为所述目标路口设置的目标智能单体对应的所述值网络。2.根据权利要求1所述的方法,其特征在于,在控制所述交通数据输入至目标值网络,并控制所述目标值网络输出所述路口对应的目标控制策略之前,所述方法包括:确定用于训练所述目标值网络对应的多个训练样本;控制多个所述训练样本输入至所述目标值网络,并得到所述目标值网络输出多个控制策略;确定多个所述控制策略对应的多个价值,并确定多个所述价值中的最大价值,将所述最大价值对应的所述控制策略确定为所述目标值网络的目标输出值;控制所述目标输出值反馈至所述目标值网络,并依据所述目标输出值更新所述目标值网络。3.根据权利要求2所述的方法,其特征在于,确定用于训练所述目标值网络对应的多个训练样本,包括:确定所述预设交通区域包括的多个所述路口,并确定多个所述路口对应的多个智能单体;确定多个所述智能单体对应的多个所述值网络,控制多个所述值网络构成混合网络;依据所述混合网络,确定多个所述训练样本。4.根据权利要求3所述的方法,其特征在于,依据所述混合网络,确定多个所述训练样本,包括:确定所述目标智能单体在历史时间段内接收的目标交通数据;确定其余多个所述智能单体在所述历史时间段内接收的多组交通数据,其中,其余多个所述智能单体为所述混合网络中除所述目标智能单体外的所有所述智能单体;确定所述目标交通数据与多组所述交通数据之间对应的多个互信息;依据所述目标交通数据以及多个所述互信息,确定所述训练样本。5.根据权利要求4所述的方法,其特征在于,确定所述目标交通数据与...
【专利技术属性】
技术研发人员:陈湘源,杨聪明,高启业,解鑫,杨进,胡比洋,袁晓敏,李建永,石珂,李星,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。