【技术实现步骤摘要】
本申请涉及工业智能控制,具体涉及一种基于深度学习与强化学习的自适应控制优化方法。
技术介绍
1、现有工业智能控制主要是基于数学模型的传统控制算法,建立线性或简化非线性数学模型实现控制参数调整,但传统控制算法基于线性或局部线性假设设计,难以准确描述复杂工业场景中的非线性动态特性,模型误差积累会导致控制失稳。
2、现有工业智能控制还利用循环神经网络、长短期记忆网络等时序模型预测未来传感器数据,再通过强化学习模型生成最佳控制策略,然而深度学习模型通常假设输入数据完整,未内置针对数据丢失情况的鲁棒性机制,当部分传感器数据丢失时,模型直接使用原始输入进行预测,强化学习模型则通过使用带误差的预测值生成控制策略,造成了误差积累,因此对精度要求高的工业场景可能出现生产事故。
3、现有技术如公告号为:cn113325721a的专利技术申请专利公开的一种工业系统无模型自适应控制方法及系统,包括:获取工业过程中各种设备的历史监测数据;利用所述可控制类数据生成控制指令集合;所述控制指令集合包括多条下一时刻生成的控制指令;根据所述历史监测
...【技术保护点】
1.一种基于深度学习与强化学习的自适应控制优化方法,其特征在于,包括:
2.根据权利要求1所述的一种基于深度学习与强化学习的自适应控制优化方法,其特征在于,所述对数据进行处理,具体过程如下:
3.根据权利要求2所述的一种基于深度学习与强化学习的自适应控制优化方法,其特征在于,所述根据处理后的数据生成对应的掩码矩阵,具体过程如下:
4.根据权利要求3所述的一种基于深度学习与强化学习的自适应控制优化方法,其特征在于,所述构建时空融合深度学习模型,具体过程如下:
5.根据权利要求4所述的一种基于深度学习与强化学习的自适应控制优
...【技术特征摘要】
1.一种基于深度学习与强化学习的自适应控制优化方法,其特征在于,包括:
2.根据权利要求1所述的一种基于深度学习与强化学习的自适应控制优化方法,其特征在于,所述对数据进行处理,具体过程如下:
3.根据权利要求2所述的一种基于深度学习与强化学习的自适应控制优化方法,其特征在于,所述根据处理后的数据生成对应的掩码矩阵,具体过程如下:
4.根据权利要求3所述的一种基于深度学习与强化学习的自适应控制优化方法,其特征在于,所述构建时空融合深度学习模型,具体过程如下:
5.根据权利要求4所述的一种基于深度学习与强化学习的自适应控制优化方法,其特征在于,所述存在缺失值的时间序列数据之间的时间和空间特征,具体过程如下:
6.根据权利要求5所述的一种基于深度学习与强化学习的自适应控制优化方法,其特征在于,所述最终生成未来步数的预测值,...
【专利技术属性】
技术研发人员:王明昕,张博,陈思宁,
申请(专利权)人:傲拓科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。