用于控制技术系统的方法和控制装置制造方法及图纸

技术编号:41670923 阅读:31 留言:0更新日期:2024-06-14 15:27
为了控制技术系统(TS)而读入训练数据,其中,相应的训练数据集(TD)包括状态数据集(S)、动作数据集(A)以及该技术系统的所产生的性能值(R)。使用训练数据将第一机器学习模块(NN1)训练为,使用状态数据集(S)和动作数据集(A)来再现所得到的性能值(R)。此外,向多个不同的确定性控制代理(P1、P2、…)分别输送状态数据集(S),并且将所得到的输出数据馈送到经过训练的第一机器学习模块(NN1)作为动作数据集。于是,根据通过经过训练的第一机器学习模块(NN1)输出的性能值,选择所述控制代理其中的多个。根据本发明专利技术,技术系统分别由所选择的控制代理(SP1,…,SPK)来控制,其中另外的状态数据集(ES)、动作数据集(EA)和性能值(ER)被检测并添加到所述训练数据中。利用由此而得以补充的训练数据,从第一机器学习模块(NN1)的训练开始重复上述方法步骤。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍

1、数据驱动的机器学习方法越来越大程度地用于控制复杂的技术系统,例如燃气涡轮机、风力涡轮机、蒸汽涡轮机、电机、机器人、化学反应器、铣床、生产设施、冷却设施或供热设施。在此情况下,通过强化学习(reinforcement learning)方法特别是将人工神经网络训练为,针对技术系统的相应状态而生成状态特定的控制动作以控制技术系统,通过所述控制动作而优化技术系统的性能。这种针对技术系统的控制而优化的控制代理通常也被称为策略(policy),或简称为代理。

2、为了成功地优化控制代理而通常需要大量的技术系统运行数据作为训练数据。训练数据在此应尽可能具有代表性地涵盖技术系统的这些运行状态和其他运行条件。

3、在许多情况下,此类训练数据以数据库的形式而存在,其中在这些数据库中存储有在技术系统上所记录的运行数据。这种所存储的训练数据通常也称为批量训练数据或离线训练数据。根据经验,训练的成功通常取决于批量训练数据覆盖技术系统可能的运行条件的程度。相应地应预期,使用批量训练数据训练的控制代理在只有少量批量训练数据的这种运行状态下表现不本文档来自技高网...

【技术保护点】

1.一种用于控制技术系统(TS)的计算机实现的方法,其中

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求2所述的方法,其特征在于,将相应控制代理的距离与阈值(TH)进行比较,并且

4.根据权利要求3所述的方法,其特征在于,在重复所述方法步骤时提高所述阈值(TH)。

5.根据权利要求2至4中任一项所述的方法,其特征在于,

6.根据前述权利要求中任一项所述的方法,其特征在于:

7.根据前述权利要求中任一项所述的方法,其特征在于

8.根据前述权利要求中任一项所述的方法,其特征在

9....

【技术特征摘要】
【国外来华专利技术】

1.一种用于控制技术系统(ts)的计算机实现的方法,其中

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求2所述的方法,其特征在于,将相应控制代理的距离与阈值(th)进行比较,并且

4.根据权利要求3所述的方法,其特征在于,在重复所述方法步骤时提高所述阈值(th)。

5.根据权利要求2至4中任一项所述的方法,其特征在于,

6.根据前述权利要求中任一项所述的方法,其特征在于:

7.根据前述权利要求中任一项所述的方法,其特征在于

8.根据前述权利要求中任一...

【专利技术属性】
技术研发人员:P·斯瓦辛纳C·奥特H·舍纳S·乌德鲁夫特
申请(专利权)人:西门子股份公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1