自动化安全和性能稳健性制造技术

技术编号:24321650 阅读:11 留言:0更新日期:2020-05-29 16:55
本公开提供了“自动化安全和性能稳健性”。一种用于控制机械臂的控制与学习模块,包括至少一个学习模块,所述至少一个学习模块包括至少一个神经网络。所述至少一个神经网络被配置成在初始学习阶段期间接收基于当前状态的测量的状态测量结果和基于观测数据的观测测量结果两者,并且通过所述状态测量结果和所述观测测量结果进行训练。所述至少一个学习模块还被配置成当所述机械臂处于正常操作时以及在所述初始学习阶段之后通过经更新的观测数据进行重新调谐,以便在操作与辅助学习阶段期间提高性能。

【技术实现步骤摘要】
自动化安全和性能稳健性
本公开涉及用于控制自动化系统的系统和方法,并且更具体来说,涉及机器人学中的机器学习和稳健控制系统和方法。
技术介绍
此部分中的陈述仅提供与本公开相关的背景信息,并且可能不构成现有技术。在自动化系统中已经使用机器学习技术。当用于汽车制造线中时,自动化系统还要求在处置关键使命任务的过程中的性能和安全稳健性。除了人类安全问题之外,突发事故可能会导致生产线上的停机时间,从而导致数千美元的损失。深度神经网络是已经在自动化系统中使用的机器学习技术之一。然而,常规的深度学习技术无法提供任何安全和性能稳健性保证,并且可能会阻止制造商在关键使命自动化任务中采用深度学习技术。除了性能和安全稳健性问题之外,适应未知的环境变量和它们的对应变化性的能力是新一代自动化工具的另一急需的特性。因此,需要允许以无人监管的方式使用于在机器学习过程中与环境的正常交互期间捕获的信息来提高感知和控制策略。最重要的是,应通过安全的方式实施所述学习过程以避免代价高的突发事故。在本公开中解决上述问题和相关联的需求。
技术实现思路
在本公开的一种形式中,用于控制机械臂的控制与学习模块包括至少一个学习模块,所述至少一个学习模块包括至少一个神经网络。所述至少一个神经网络被配置成在初始学习阶段期间接收基于当前状态的测量的状态测量结果和基于观测数据的观测测量结果,并且通过所述状态测量结果和所述观测测量结果进行训练。所述至少一个学习模块还被配置成当机械臂处于正常操作时以及在所述初始学习阶段之后通过经更新的观测数据进行重新调谐,以便在操作与辅助学习阶段期间提高性能。在其他特征中,所述状态测量结果表示通过传感器获得的实际当前状态。所述至少一个神经网络被表示为贝叶斯神经网络,并且被配置成产生与输出任务相关的输出和与所述输出相关联的方差。所述方差是与所述输出任务的可靠性相关的不确定性的量度。所述至少一个学习模块包括:状态估计模块,所述状态估计模块被配置成仅基于所述观测测量结果而提供所估计的状态;以及动态建模模块,所述动态建模模块被配置成产生动态模型和动态模型输出方差,所述动态模型输出方差表示所述动态模型的不确定性。所述状态估计模块被配置成输出第一估计当前状态和与所述第一估计当前状态相关联的方差。所述动态建模模块被配置成输出第二估计当前状态。所述状态估计模块和所述动态建模模块各自被配置成接收与所述第一估计当前状态与所述第二估计当前状态之间的差异相关的输入,以在所述操作与辅助学习阶段期间提高性能。所述所估计的状态可以包括环境中的障碍物和目标对象的所估计的位置和速度,或完全限定机器人的关于所述环境的其他信息(在机器人外部)。所述控制与学习模块还包括控制策略模块、最优控制模块和可达性分析模块。所述控制策略模块被配置成仅在所述操作与辅助学习阶段期间基于来自所述状态估计模块的所估计的当前状态而产生控制策略命令和与所述控制策略命令相关联的控制策略方差。所述最优控制模块被配置成基于来自先验的可用模型的动态模型或由动态建模模块学习的动态模型以及状态测量结果或所估计的状态来产生最优控制命令。当控制策略方差大于与其中控制策略对其所产生的输出不确定的情况相对应的预定义的方差阈值时,所述最优控制模块可以超驰来自控制策略模块的控制策略命令。可达性分析模块可以从所述动态建模模块接收状态测量结果、动态模型参数和相关联的输出或参数方差,并且确定当前状态是否处于安全状态。当所述可达性分析模块确定当前状态处于不安全状态时,所述可达性分析模块可以产生超驰来自最优控制模块的最优控制命令或所述控制策略(如果有效)的稳健控制命令。所述状态估计模块、所述动态建模模块和所述控制策略模块各自包括在初始学习阶段以及操作与辅助学习阶段两者中接受训练的神经网络,并且各自输出表示所述状态估计模块、所述动态建模模块和所述控制策略模块中的每一者的不确定性的方差。所述动态建模模块包括初步动态模型和补充动态模型,所述初步动态模型是预先确定的,并且基于关于机械臂的系统动态的现有知识来提供状态预测。所述补充动态模型可以产生用于校正由所述初步动态模型提供的所述状态预测的校正参数,以及与所述校正参数相关联的动态模型方差。应注意,在以下描述中单独地陈述的特征可以通过任何技术上有利的方式彼此组合,并且陈述本公开的其他变化。所述描述另外尤其结合附图表征和指定本公开。通过本文提供的描述,其他适用领域将变得显而易见。应理解,描述和特定示例旨在仅用于说明目的,而非旨在限制本公开的范围。附图说明为了可以更好地理解本公开,现在将参考附图以示例的方式描述本公开的各种形式,附图中:图1是根据本公开的教导而构建的包括控制与学习模块的自动化系统的示意图;图2是根据本公开的教导而构建的控制与学习模块的初始学习阶段的流程图;以及图3是根据本公开的教导而构建的控制与学习模块的操作与辅助学习阶段的流程图。本文描述的图式仅用于说明目的,而绝非旨在限制本公开的范围。具体实施方式以下描述本质上仅仅是示例性的,而非旨在限制本公开、应用或用途。应理解,在所有图式中,对应参考数字指示相同或对应的部分和特征。在包括以下定义的本申请中,术语“模块”或术语“控制器”可以被术语“电路”取代。术语“模块”可以指以下各者、是以下各者的部分,或包括以下各者:专用集成电路(ASIC);数字电路、模拟电路,或混合模拟/数字分立电路;数字集成电路、模拟集成电路,或混合模拟/数字集成电路;组合逻辑电路;现场可编程门阵列(FPGA);执行代码的处理器电路(共享、专用或组);存储由所述处理器电路执行的代码的存储器电路(共享、专用或组);提供所描述的功能性的其他合适的硬件部件;或以上各者中的一些或全部的组合,例如处于系统芯片中。所述模块可以包括一个或多个接口电路。在一些示例中,所述接口电路可以包括连接到局域网(LAN)、互联网、广域网(WAN)或其组合的有线或无线接口。本公开的任何给定模块的功能性可以分布在经由接口电路连接的多个模块之间。举例来说,多个模块可以允许负荷平衡。在另一示例中,服务器(还称为远程或云)模块可以实现代表客户端模块的某一功能性。参看图1,根据本公开的教导而构建的自动化系统10包括机械臂12、观测系统14、测量装置16,和用于控制机械臂12以实现安全和有效操作的控制与学习模块18。控制与学习模块18使得机械臂12能够执行关键使命任务,例如生产线上的组装任务、操纵任务或检查任务。观测系统14可以包括用于向控制与学习模块18提供例如呈相机图像或视觉数据的形式的观测测量结果的相机。在另一形式中,观测系统14可以包括LiDAR或RADAR。观测系统14表示可以直接提供或可以不直接提供系统状态的通用观测单元。如果不可以直接访问状态值,那么需要进一步处理和分析由观测系统14提供的观测测量结果以提供所估计的状态值。测量装置16可以包括多个辅助传感器以直接捕获和测量状态值。因此,测量装置16提供表示当前状态的实际值的状态测量本文档来自技高网...

【技术保护点】
1.一种用于控制机械臂的控制与学习模块,其包括:/n至少一个学习模块,所述至少一个学习模块包括至少一个神经网络,/n其中所述至少一个神经网络被配置成在初始学习阶段期间接收基于当前状态的测量的状态测量结果以及基于观测数据的观测测量结果两者并且通过所述状态测量结果和所述观测测量结果进行训练,并且被配置成当所述机械臂处于正常操作时以及在所述初始学习阶段之后通过经更新的观测数据进行重新调谐,以在操作与辅助学习阶段期间提高性能。/n

【技术特征摘要】
20181121 US 16/197,6491.一种用于控制机械臂的控制与学习模块,其包括:
至少一个学习模块,所述至少一个学习模块包括至少一个神经网络,
其中所述至少一个神经网络被配置成在初始学习阶段期间接收基于当前状态的测量的状态测量结果以及基于观测数据的观测测量结果两者并且通过所述状态测量结果和所述观测测量结果进行训练,并且被配置成当所述机械臂处于正常操作时以及在所述初始学习阶段之后通过经更新的观测数据进行重新调谐,以在操作与辅助学习阶段期间提高性能。


2.根据权利要求1所述的控制与学习模块,其中所述状态测量结果是通过传感器获得并且表示实际当前状态。


3.根据权利要求1所述的控制与学习模块,其中所述至少一个神经网络被配置成产生与输出任务相关的输出和与所述输出相关联的方差,所述方差是与所述输出任务的可靠性相关的不确定性的量度,所述至少一个神经网络优选地表示为贝叶斯神经网络。


4.根据权利要求1所述的控制与学习模块,其中所述至少一个学习模块包括:
状态估计模块,所述状态估计模块被配置成仅基于所述观测测量结果而提供所估计的状态;以及
动态建模模块,所述动态建模模块被配置成产生动态模型和动态模型输出方差,所述动态模型输出方差表示所述动态模型的不确定性。


5.根据权利要求4所述的控制与学习模块,其中所述状态估计模块被配置成输出第一估计当前状态和与所述第一估计当前状态相关联的方差。


6.根据权利要求5所述的控制与学习模块,其中所述动态建模模块被配置成输出第二估计当前状态。


7.根据权利要求6所述的控制与学习模块,其中所述状态估计模块和所述动态建模模块各自被配置成接收与所述第一估计当前状态与所述第二估计当前状态之间的差异相关的输入,以在所述操作与辅助学习阶段期间提高性能。


8.根据权利要求4所述的控制与学习模块,其中所述所估计的...

【专利技术属性】
技术研发人员:伊曼·索尔塔尼博兹查洛伊
申请(专利权)人:福特全球技术公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1