盾构机的土压平衡自主智能控制方法及系统技术方案

技术编号:38211024 阅读:16 留言:0更新日期:2023-07-21 17:02
本发明专利技术公开了一种盾构机的土压平衡自主智能控制方法及系统,涉及土压平衡盾构机技术领域,主要目的在于现有盾构机的土压平衡自主智能控制的有效性差的问题。包括:获取土压平衡盾构机的目标土压参数;构建匹配所述目标土压参数的密封舱压力环境模型,所述密封舱压力环境模型中表征有基于出土量与进土量的恒等性以及密封舱压力与螺旋输送机转速、推进速度之间的映射关系;基于深度确定性策略梯度模型对所述密封舱压力环境模型得到的控制土压平衡盾构机土压平衡状态进行预测处理,得到控制策略,并基于所述控制策略对所述土压平衡盾构机进行控制。机进行控制。机进行控制。

【技术实现步骤摘要】
盾构机的土压平衡自主智能控制方法及系统


[0001]本专利技术涉及一种盾构机
,特别是涉及一种盾构机的土压平衡自主智能控制方法及系统。

技术介绍

[0002]盾构机是城市地下交通建设、公路、铁路隧道、引水隧洞工程等重大施工建设中必不可少的特大型专业工程机械装备。对于土压平衡式盾构机而言,由于地下环境因素的不可控性,如果密封舱的土压力大于开挖面的水土压力,地表将发生隆起;反之,地表发生沉陷。因此,保持密封舱内的土压力与开挖面的水土压力的动态平衡是盾构机安全掘进的关键因素,实施密封舱土压平衡的多系统自主调控是十分必要的,以实现盾构机智能化、无人值守施工作业,这也是未来盾构机发展的必然趋势。
[0003]目前,现有通常基于数据驱动结合机器学习模型来进行土压平衡的优化控制。但是,基于数据驱动的土压平衡优化控制方法,需要大量标注好的样本进行网络训练,对数据的依赖性较大,其训练结果的优劣很大程度上取决于训练样本的选取,而且人工进行大量训练样本的标注效率低,大大降低了盾构机的土压平衡自主智能控制的有效性。

技术实现思路

[0004]有鉴于此,本专利技术提供一种盾构机的土压平衡自主智能控制方法及系统,主要目的在于现有盾构机的土压平衡自主智能控制的有效性差的问题。
[0005]依据本专利技术一个方面,提供了一种盾构机的土压平衡自主智能控制方法,包括:
[0006]获取土压平衡盾构机的目标土压参数;
[0007]构建匹配所述目标土压参数的密封舱压力环境模型,所述密封舱压力环境模型中表征有基于出土量与进土量的恒等性以及密封舱压力与螺旋输送机转速、推进速度之间的映射关系;
[0008]基于深度确定性策略梯度模型对所述密封舱压力环境模型得到的控制盾构机土压平衡状态进行预测处理,得到控制策略,并基于所述控制策略对所述土压平衡盾构机进行控制。
[0009]进一步地,所述基于深度确定性策略梯度模型对所述密封舱压力环境模型得到的控制盾构机土压平衡状态进行预测处理,得到控制策略之前,所述方法还包括:
[0010]构建深度确定性策略梯度网络,所述深度确定性策略梯度网络包括策略网络、评估网络;
[0011]获取土压平衡状态控制策略训练样本集,所述土压平衡状态控制策略训练样本包括作为输入参数的状态变量训练样本数据以及作为输出参数的策略动作训练样本数据;
[0012]基于所述状态变量训练样本数据、所述策略动作训练样本数据以及控制盾构机土压平衡状态训练样本数据对所述深度确定性策略梯度网络进行模型训练,得到深度确定性策略梯度模型。
[0013]进一步地,所述基于所述状态变量训练样本数据、所述策略动作训练样本数据以及控制盾构机土压平衡状态训练样本数据对所述深度确定性策略梯度网络进行模型训练,得到深度确定性策略梯度模型包括:
[0014]基于所述密封舱压力环境模型获取控制盾构机土压平衡状态训练样本数据,并获取执行动作以及所述执行动作所对应的奖励参数;
[0015]基于所述土压平衡状态训练样本数据、所述状态变量训练样本数据、所述策略动作训练样本数据、所述执行动作、所述奖励参数分别对所述策略网络、所述评估网络中的网络参数进行迭代更新;
[0016]当迭代更新后所述深度确定性策略梯度网络的模型准确参数匹配预设模型准确阈值,则完成所述深度确定性策略梯度网络的模型训练,得到所述深度确定性策略梯度模型;
[0017]其中,所述状态变量训练样本数据包括密封舱压力值、目标压力设定值、压力误差绝对值,所述策略动作训练样本数据包括调节刀盘转速、螺旋输送机转速以及推进速度。
[0018]进一步地,所述方法还包括:
[0019]基于所述控制策略中输出压力值与目标土压参数的误差绝对值、以及所述输出压力值确定奖励函数;
[0020]将所述奖励函数配置于所述评估网络中,以使所述策略网络中的策略动作按照所述奖励函数进行调整。
[0021]进一步地,所述构建匹配所述目标土压参数的密封舱压力环境模型包括:
[0022]获取所述土压平衡盾构机的出土量、进土量,所述出土量为基于推进速度、刀盘半径、圆周率进行表征,所述进土量为基于排土效率、螺旋输送机有效断面积、螺旋输送机的叶片螺距、螺旋输送机转速、圆周率进行表征;
[0023]在所述出土量与所述进土量相等的条件下,确定密封舱内渣土流量的连续函数;
[0024]在密封舱外部泄漏系数与密封舱外部泄漏土体压力乘积为零的条件下,确定所述密封舱压力环境模型。
[0025]进一步地,所述构建匹配所述目标土压参数的密封舱压力环境模型之后,所述方法还包括:
[0026]创建与所述密封舱压力环境模型匹配的训练物模型;
[0027]所述基于所述密封舱压力环境模型获取控制盾构机土压平衡状态训练样本数据包括:
[0028]基于所述训练物模型得到所述土压平衡盾构机进行策略动作控制时的密封舱压力值,生成所述控制盾构机土压平衡状态训练样本数据。
[0029]进一步地,所述获取土压平衡盾构机的目标土压参数包括:
[0030]获取所述土压平衡盾构机的盾尾后水压力参数、刀盘前水压力参数、被动土压力参数、主动土压力参数、预备压力参数;
[0031]根据所述盾尾后水压力参数、所述刀盘前水压力参数、所述被动土压力参数、所述预备压力参数之间的第一函数关系确定压力上限值,并根据所述盾尾后水压力参数、所述刀盘前水压力参数、所述主动土压力参数之间的第二函数关系确定压力下限值;
[0032]确定包含所述压力上限值、所述压力下限值的目标土压参数。
[0033]依据本专利技术另一个方面,提供了一种盾构机的土压平衡自主智能控制系统,包括:
[0034]获取模块,用于获取土压平衡盾构机的目标土压参数;
[0035]构建模块,用于构建匹配所述目标土压参数的密封舱压力环境模型,所述密封舱压力环境模型中表征有基于出土量与进土量的恒等性以及密封舱压力与螺旋输送机转速、推进速度之间的映射关系;
[0036]控制模块,用于基于深度确定性策略梯度模型对所述密封舱压力环境模型得到的控制盾构机土压平衡状态进行预测处理,得到控制策略,并基于所述控制策略对所述土压平衡盾构机进行控制。
[0037]进一步地,所述系统还包括:训练模块,
[0038]所述构建模块,还用于构建深度确定性策略梯度网络,所述深度确定性策略梯度网络包括策略网络、评估网络;
[0039]所述获取模块,还用于获取土压平衡状态控制策略训练样本集,所述土压平衡状态控制策略训练样本包括作为输入参数的状态变量训练样本数据以及作为输出参数的策略动作训练样本数据;
[0040]所述训练模块,用于基于所述状态变量训练样本数据、所述策略动作训练样本数据以及控制盾构机土压平衡状态训练样本数据对所述深度确定性策略梯度网络进行模型训练,得到深度确定性策略梯度模型。
[0041]进一步地,所述训练模块,具体用于基于所述密封本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种盾构机的土压平衡自主智能控制方法,其特征在于,包括:获取土压平衡盾构机的目标土压参数;构建匹配所述目标土压参数的密封舱压力环境模型,所述密封舱压力环境模型中表征有基于出土量与进土量的恒等性以及密封舱压力与螺旋输送机转速、推进速度之间的映射关系;基于深度确定性策略梯度模型对所述密封舱压力环境模型得到的控制盾构机土压平衡状态进行预测处理,得到控制策略,并基于所述控制策略对所述土压平衡盾构机进行控制。2.根据权利要求1所述的方法,其特征在于,所述基于深度确定性策略梯度模型对所述密封舱压力环境模型得到的控制盾构机土压平衡状态进行预测处理,得到控制策略之前,所述方法还包括:构建深度确定性策略梯度网络,所述深度确定性策略梯度网络包括策略网络、评估网络;获取土压平衡状态控制策略训练样本集,所述土压平衡状态控制策略训练样本包括作为输入参数的状态变量训练样本数据以及作为输出参数的策略动作训练样本数据;基于所述状态变量训练样本数据、所述策略动作训练样本数据以及控制盾构机土压平衡状态训练样本数据对所述深度确定性策略梯度网络进行模型训练,得到深度确定性策略梯度模型。3.根据权利要求2所述的方法,其特征在于,所述基于所述状态变量训练样本数据、所述策略动作训练样本数据以及控制盾构机土压平衡状态训练样本数据对所述深度确定性策略梯度网络进行模型训练,得到深度确定性策略梯度模型包括:基于所述密封舱压力环境模型获取控制盾构机土压平衡状态训练样本数据,并获取执行动作以及所述执行动作所对应的奖励参数;基于所述土压平衡状态训练样本数据、所述状态变量训练样本数据、所述策略动作训练样本数据、所述执行动作、所述奖励参数分别对所述策略网络、所述评估网络中的网络参数进行迭代更新;当迭代更新后所述深度确定性策略梯度网络的模型准确参数匹配预设模型准确阈值,则完成所述深度确定性策略梯度网络的模型训练,得到所述深度确定性策略梯度模型;其中,所述状态变量训练样本数据包括密封舱压力值、目标压力设定值、压力误差绝对值,所述策略动作训练样本数据包括调节刀盘转速、螺旋输送机转速以及推进速度。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:基于所述控制策略中输出压力值与目标土压参数的误差绝对值、以及所述输出压力值确定奖励函数;将所述奖励函数配置于所述评估网络中,以使所述策略网络中的策略动作按照所述奖励函数进行调整。5.根据权利要求3所述的方法,其特征在于,所述构建匹配所述目标土压参数的密封舱压力环境模型包括:获取所述土压平衡盾构机的出土量、进...

【专利技术属性】
技术研发人员:刘宣宇张文帅
申请(专利权)人:辽宁石油化工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1