一种基于深度学习与强化学习的自适应控制优化方法技术

技术编号：46617077 阅读：1 留言：0更新日期：2025-10-14 21:13

本申请公开了一种基于深度学习与强化学习的自适应控制优化方法，涉及工业智能控制技术领域，本申请通过根据采集到的数据构建掩码矩阵，再通过将多尺度时序卷积层和图卷积网络与数据的掩码矩阵相结合，生成未来步数的预测值，据此构建时空融合深度学习模型，进而根据时空融合深度学习模型的预测值，构建状态向量，从而根据状态向量生成最佳控制策略，本申请通过将时空融合深度学习与强化学习的嵌入式协同，构建预测‑决策‑执行的全闭环工业控制架构，针对传感器数据部分缺失及多变量非线性耦合的复杂工业场景，在边缘控制器内实现推理‑控制一体化，实现了高精度、强鲁棒性的自适应控制优化。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及工业智能控制，具体涉及一种基于深度学习与强化学习的自适应控制优化方法。

技术介绍

1、现有工业智能控制主要是基于数学模型的传统控制算法，建立线性或简化非线性数学模型实现控制参数调整，但传统控制算法基于线性或局部线性假设设计，难以准确描述复杂工业场景中的非线性动态特性，模型误差积累会导致控制失稳。

2、现有工业智能控制还利用循环神经网络、长短期记忆网络等时序模型预测未来传感器数据，再通过强化学习模型生成最佳控制策略，然而深度学习模型通常假设输入数据完整，未内置针对数据丢失情况的鲁棒性机制，当部分传感器数据丢失时，模型直接使用原始输入进行预测，强化学习模型则通过使用带误差的预测值生成控制策略，造成了误差积累，因此对精度要求高的工业场景可能出现生产事故。

3、现有技术如公告号为：cn113325721a的专利技术申请专利公开的一种工业系统无模型自适应控制方法及系统，包括：获取工业过程中各种设备的历史监测数据；利用所述可控制类数据生成控制指令集合；所述控制指令集合包括多条下一时刻生成的控制指令；根据所述历史监测...

【技术保护点】

1.一种基于深度学习与强化学习的自适应控制优化方法，其特征在于，包括：

2.根据权利要求1所述的一种基于深度学习与强化学习的自适应控制优化方法，其特征在于，所述对数据进行处理，具体过程如下：

3.根据权利要求2所述的一种基于深度学习与强化学习的自适应控制优化方法，其特征在于，所述根据处理后的数据生成对应的掩码矩阵，具体过程如下：

4.根据权利要求3所述的一种基于深度学习与强化学习的自适应控制优化方法，其特征在于，所述构建时空融合深度学习模型，具体过程如下：

5.根据权利要求4所述的一种基于深度学习与强化学习的自适应控制优化方法，其特征在于，...

【技术特征摘要】

1.一种基于深度学习与强化学习的自适应控制优化方法，其特征在于，包括：

2.根据权利要求1所述的一种基于深度学习与强化学习的自适应控制优化方法，其特征在于，所述对数据进行处理，具体过程如下：

4.根据权利要求3所述的一种基于深度学习与强化学习的自适应控制优化方法，其特征在于，所述构建时空融合深度学习模型，具体过程如下：

5.根据权利要求4所述的一种基于深度学习与强化学习的自适应控制优化方法，其特征在于，所述存在缺失值的时间序列数据之间的时间和空间特征，具体过程如下：

6.根据权利要求5所述的一种基于深度学习与强化学习的自适应控制优化方法，其特征在于，所述最终生成未来步数的预测值，...

【专利技术属性】
技术研发人员：王明昕，张博，陈思宁，
申请(专利权)人：傲拓科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人