【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
1、数据驱动的机器学习方法越来越大程度地用于控制复杂的技术系统,例如燃气涡轮机、风力涡轮机、蒸汽涡轮机、电机、机器人、化学反应器、铣床、生产设施、冷却设施或供热设施。在此情况下,通过强化学习(reinforcement learning)方法特别是将人工神经网络训练为,针对技术系统的相应状态而生成状态特定的控制动作以控制技术系统,通过所述控制动作而优化技术系统的性能。这种针对技术系统的控制而优化的控制代理通常也被称为策略(policy),或简称为代理。
2、为了成功地优化控制代理而通常需要大量的技术系统运行数据作为训练数据。训练数据在此应尽可能具有代表性地涵盖技术系统的这些运行状态和其他运行条件。
3、在许多情况下,此类训练数据以数据库的形式而存在,其中在这些数据库中存储有在技术系统上所记录的运行数据。这种所存储的训练数据通常也称为批量训练数据或离线训练数据。根据经验,训练的成功通常取决于批量训练数据覆盖技术系统可能的运行条件的程度。相应地应预期,使用批量训练数据训练的控制代理在只有少量批量训练数据的
...【技术保护点】
1.一种用于控制技术系统(TS)的计算机实现的方法,其中
2.根据权利要求1所述的方法,其特征在于,
3.根据权利要求2所述的方法,其特征在于,将相应控制代理的距离与阈值(TH)进行比较,并且
4.根据权利要求3所述的方法,其特征在于,在重复所述方法步骤时提高所述阈值(TH)。
5.根据权利要求2至4中任一项所述的方法,其特征在于,
6.根据前述权利要求中任一项所述的方法,其特征在于:
7.根据前述权利要求中任一项所述的方法,其特征在于
8.根据前述权利要求中任一项所述的方法,其特征在
9....
【技术特征摘要】
【国外来华专利技术】
1.一种用于控制技术系统(ts)的计算机实现的方法,其中
2.根据权利要求1所述的方法,其特征在于,
3.根据权利要求2所述的方法,其特征在于,将相应控制代理的距离与阈值(th)进行比较,并且
4.根据权利要求3所述的方法,其特征在于,在重复所述方法步骤时提高所述阈值(th)。
5.根据权利要求2至4中任一项所述的方法,其特征在于,
6.根据前述权利要求中任一项所述的方法,其特征在于:
7.根据前述权利要求中任一项所述的方法,其特征在于
8.根据前述权利要求中任一...
【专利技术属性】
技术研发人员:P·斯瓦辛纳,C·奥特,H·舍纳,S·乌德鲁夫特,
申请(专利权)人:西门子股份公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。