工业厂房控制器制造技术

技术编号：29035525 阅读：15 留言：0更新日期：2021-06-26 05:43

用于训练控制工业厂房的操作的工业厂房控制器的方法、系统和设备、包括在计算机存储介质上编码的计算机程序。在一个方面中，一种方法，其包括使用模拟所述工业厂房的操作的工业厂房模拟模型来生成训练数据。使用所述训练数据通过强化学习技术来训练所述工业厂房控制器。所述工业厂房控制器被配置成根据多个工业厂房控制器参数处理输入以生成动作选择策略输出，所述输入包括表征所述工业厂房的状态的状态向量，所述动作选择策略输出定义要执行以控制所述工业厂房的所述操作的控制动作。以控制所述工业厂房的所述操作的控制动作。以控制所述工业厂房的所述操作的控制动作。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】工业厂房控制器
[0001]相关申请的交叉引用
[0002]本申请要求2018年12月13日提交的美国临时申请No.62/779,148的优先权，所述申请的全部内容在此以引用方式并入。

技术介绍

[0003]本说明书涉及用于控制工业厂房的操作的控制系统。
[0004]工业厂房可以是处理材料(例如，化学地、机械地、电气地或其组合)以产生加工输出的任何设施。工业厂房的实例包括冶炼厂、造纸厂和炼油厂。工业厂房的控制系统可以选择要执行以控制工业厂房的操作的控制动作。因此，本专利技术的目标是避免用于工业厂房的控制系统的已知缺点。此外，本专利技术的目标是促进工业厂房的操作并提供其效率。本专利技术所基于的那些目标通过所要求保护的特征，特别是通过独立权利要求所要求保护的主题来解决。

技术实现思路

[0005]本说明书描述一种系统，所述系统被实施为在一个或多个位置中的一个或多个计算机上的计算机程序，所述系统训练控制工业厂房的操作的工业厂房控制器。
[0006]根据第一方面，提供一种方法，所述方法由一个或多个数据处理设备执行以训练控制工业厂房的操作的工业厂房控制器。所述方法包括使用模拟工业厂房的操作的工业厂房模拟模型来生成训练数据。生成训练数据包括，在多个时步中的每个时步处：使用工业厂房模拟模型处理(i)表征在当前时步处工业厂房的模拟状态的当前状态向量，以及(ii)要在当前时步处执行的控制动作；使用工业厂房模拟模型生成表征在执行控制动作之后的工业厂房的模拟状态的后续状态向量；以及至少基于表征在执行控制动作之后的工业...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种由一个或多个数据处理设备执行的用于训练工业厂房控制器的方法，所述工业厂房控制器用于控制工业厂房的操作，所述方法包括：使用模拟所述工业厂房的操作的工业厂房模拟模型来生成训练数据，包括：在多个时步中的每个时步处，使用所述工业厂房模拟模型，处理(i)表征在当前时步处所述工业厂房的模拟状态的当前状态向量，以及(ii)要在所述当前时步处执行的控制动作；使用所述工业厂房模拟模型，生成表征在执行所述控制动作之后的所述工业厂房的所述模拟状态的后续状态向量；并且至少基于表征在执行所述控制动作之后的所述工业厂房的所述模拟状态的所述后续状态向量，确定在所述当前时步处接收到的奖励；并且使用所述训练数据通过强化学习技术训练所述工业厂房控制器，其中，所述工业厂房控制器被配置成：根据多个工业厂房控制器参数对以下输入进行处理以生成动作选择策略输出，所述输入包括表征所述工业厂房的状态的状态向量，所述动作选择策略输出定义要被执行以控制所述工业厂房的所述操作的控制动作。2.根据权利要求1所述的方法，其中，所述训练包括：调整所述多个工业厂房控制器参数的值，以增加通过执行由所述工业厂房控制器所生成的动作选择策略输出所定义的控制动作而被接收到的累积奖励的度量。3.根据权利要求1或2所述的方法，其中，使用并行运行的所述工业厂房模拟模型的多个实例来生成所述训练数据。4.根据权利要求1至3中任一项所述的方法，其中，生成所述训练数据进一步包括：在一个或多个特定时步处，调整所述当前状态向量，以模拟影响所述工业厂房的所述操作的事件的发生。5.根据权利要求1至4中任一项所述的方法，其中，所述事件包括所述工业厂房中的设备故障。6.根据权利要求1至5中任一项所述的方法，其中，在每个特定时步处，通过从可能事件的预定集合上的概率分布进行采样来确定所述事件，其中，所述可能事件包括不影响所述工业厂房的所述操作的非事件。7.根据权利要求1至6中任一项所述的方法，其中，在所述时步处接收到的所述奖励表征了在所述时步处执行的所述控制动作如何有效地完成某些任务。8.根据权利要求1至7中任一项所述的方法，进一步包括：确定所述工业厂房控制器是否通过一个或多个认证测试，其中，认证测试评估所述工业厂房控制器是否能够通过根据所述多个工业厂房控制器参数的当前值生成控制动作来有效地控制所述工业厂房的所述操作；并且响应于确定所述工业厂房控制器通过所述认证测试，使用所述工业厂房控制器来控制所述工业厂房的所述操作。9.根据权利要求1至8中任一项所述的方法，进一步包括：使用所述工业厂房控制器来控制所述工业厂房的所述操作，包括：在多个给定时步中的每个时步处，
获得表征在所述给定时步处所述工业厂房的状态的状态向量；使用所述工业厂房控制器对以下输入进行处理以生成动作选择策略输出，所述输入包括表征在所述给定时步处所述工业厂房的所述状态的所述状态向量；以及确定要基于所述动作选择策略输出而在所述给定时步处执行的控制动作。10.根据权利要求9所述的方法，其中，所述动作选择策略输出包括对于可能控制动作的预定集合中的每个控制动作的相应分数。11.根据权利要求9或10所述的方法，其中，确定要基于所述动作选择策略输出所执行的控制动作包括：选择具有最高分数的控制动作。12.根据权利要求1至11中任一项所述的方法，其中，所述工业厂房控制器包括一个或多个神经网络，并且所述工业厂房控制器参数包括所述一个或多个神经网络的权重值。13.一种系统，包括：一个或多个计算机；以及一个或多个存储装置，所述一个或多个存储装置通信地耦合到所述一个或多...

【专利技术属性】
技术研发人员：阿瑟，
申请(专利权)人：安德里茨公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人