【技术实现步骤摘要】
盾构机的土压平衡自主智能控制方法及系统
[0001]本专利技术涉及一种盾构机
,特别是涉及一种盾构机的土压平衡自主智能控制方法及系统。
技术介绍
[0002]盾构机是城市地下交通建设、公路、铁路隧道、引水隧洞工程等重大施工建设中必不可少的特大型专业工程机械装备。对于土压平衡式盾构机而言,由于地下环境因素的不可控性,如果密封舱的土压力大于开挖面的水土压力,地表将发生隆起;反之,地表发生沉陷。因此,保持密封舱内的土压力与开挖面的水土压力的动态平衡是盾构机安全掘进的关键因素,实施密封舱土压平衡的多系统自主调控是十分必要的,以实现盾构机智能化、无人值守施工作业,这也是未来盾构机发展的必然趋势。
[0003]目前,现有通常基于数据驱动结合机器学习模型来进行土压平衡的优化控制。但是,基于数据驱动的土压平衡优化控制方法,需要大量标注好的样本进行网络训练,对数据的依赖性较大,其训练结果的优劣很大程度上取决于训练样本的选取,而且人工进行大量训练样本的标注效率低,大大降低了盾构机的土压平衡自主智能控制的有效性。
专利技术内 ...
【技术保护点】
【技术特征摘要】
1.一种盾构机的土压平衡自主智能控制方法,其特征在于,包括:获取土压平衡盾构机的目标土压参数;构建匹配所述目标土压参数的密封舱压力环境模型,所述密封舱压力环境模型中表征有基于出土量与进土量的恒等性以及密封舱压力与螺旋输送机转速、推进速度之间的映射关系;基于深度确定性策略梯度模型对所述密封舱压力环境模型得到的控制盾构机土压平衡状态进行预测处理,得到控制策略,并基于所述控制策略对所述土压平衡盾构机进行控制。2.根据权利要求1所述的方法,其特征在于,所述基于深度确定性策略梯度模型对所述密封舱压力环境模型得到的控制盾构机土压平衡状态进行预测处理,得到控制策略之前,所述方法还包括:构建深度确定性策略梯度网络,所述深度确定性策略梯度网络包括策略网络、评估网络;获取土压平衡状态控制策略训练样本集,所述土压平衡状态控制策略训练样本包括作为输入参数的状态变量训练样本数据以及作为输出参数的策略动作训练样本数据;基于所述状态变量训练样本数据、所述策略动作训练样本数据以及控制盾构机土压平衡状态训练样本数据对所述深度确定性策略梯度网络进行模型训练,得到深度确定性策略梯度模型。3.根据权利要求2所述的方法,其特征在于,所述基于所述状态变量训练样本数据、所述策略动作训练样本数据以及控制盾构机土压平衡状态训练样本数据对所述深度确定性策略梯度网络进行模型训练,得到深度确定性策略梯度模型包括:基于所述密封舱压力环境模型获取控制盾构机土压平衡状态训练样本数据,并获取执行动作以及所述执行动作所对应的奖励参数;基于所述土压平衡状态训练样本数据、所述状态变量训练样本数据、所述策略动作训练样本数据、所述执行动作、所述奖励参数分别对所述策略网络、所述评估网络中的网络参数进行迭代更新;当迭代更新后所述深度确定性策略梯度网络的模型准确参数匹配预设模型准确阈值,则完成所述深度确定性策略梯度网络的模型训练,得到所述深度确定性策略梯度模型;其中,所述状态变量训练样本数据包括密封舱压力值、目标压力设定值、压力误差绝对值,所述策略动作训练样本数据包括调节刀盘转速、螺旋输送机转速以及推进速度。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:基于所述控制策略中输出压力值与目标土压参数的误差绝对值、以及所述输出压力值确定奖励函数;将所述奖励函数配置于所述评估网络中,以使所述策略网络中的策略动作按照所述奖励函数进行调整。5.根据权利要求3所述的方法,其特征在于,所述构建匹配所述目标土压参数的密封舱压力环境模型包括:获取所述土压平衡盾构机的出土量、进...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。