对自主系统进行安全且有效的超控的系统和方法技术方案

技术编号：32868882 阅读：25 留言：0更新日期：2022-04-02 11:56

描述了一种用于自主系统的胜任力评估的系统。所述系统提取表示情境的语义概念。将自主系统采取的动作与在情境中采取所述动作时激活的语义概念集合相关联。所述系统测量在情境中采取的动作的结果并生成奖励度量。将表示情境的语义概念连同在情境中采取的动作和奖励度量一起存储为记忆。基于记忆的回忆生成前瞻性模拟结果。确定胜任力度量和经验度量。当胜任力度量和经验度量中的至少一者高于最小值时，维持对自主系统的胜任力操作控制。当胜任力度量和经验度量中的至少一者低于最小值时，生成警报。生成警报。生成警报。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】对自主系统进行安全且有效的超控的系统和方法
[0001]相关申请的交叉引用
[0002]本申请是2019年9月26日在美国提交的名称为“System and Method for Autonomous System Introspection”的美国临时申请No.62/906,269的非临时申请，其全部内容通过引用并入本文。
[0003]专利技术背景
[0004](1)

[0005]本专利技术涉及一种用于自主系统的胜任力评估(competency assessment)的系统，并且更具体地，涉及以下用于自主系统的胜任力评估的系统，该系统能够在预测到低胜任力的情况下启动到人类或辅助系统的移交。
[0006](2)相关技术描述
[0007]自主系统需要不断估计其处理即将发生的情况的能力。胜任力估计和警告的现有技术(诸如Daftry等人(参见并入的参考文献列表中的参考文献No.9))使用了深度学习，深度学习只在明确定义且受控的情况下才能运行良好、仅基于提前一帧的运动学投影并且无法评估对于假设的未来情况的胜任力。
[0008]Kansky等人(参见参考文献No.4)表明，即使是输入的细微变化也可能导致深度网络的灾难性故障。该领域没有成熟的方法来解决深度网络对输入(或低级特征)的微小变化过度敏感的问题。因此，现有技术无法针对假设情况和新情况来评估胜任力。此外，现有技术直接预测有偏差的胜任力度量，容易产生响应偏差。此外，现有技术没有评估经验深度。
[0009]因此，仍然需要如下系统：该系统不...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种对自主系统进行安全且有效的超控的系统，所述系统包括：非暂时性计算机可读介质和一个或更多个处理器，所述非暂时性计算机可读介质上编码有可执行指令，使得当执行所述可执行指令时，所述一个或更多个处理器执行以下操作：提取表示情境的多个语义概念；将所述自主系统采取的动作与在所述情境中采取所述动作时激活的语义概念集合相关联；使用所述自主系统的性能的任务特定奖励函数，测量在所述情境中采取的所述动作的结果并生成奖励度量；将表示所述情境的所述多个语义概念连同在所述情境中采取的所述动作和所述奖励度量一起存储为记忆；基于所述记忆的回忆生成前瞻性模拟结果；基于所述前瞻性模拟结果，确定表示所述自主系统在所述情境中的胜任力的胜任力度量和表示所述自主系统在所述情境中的经验的经验度量中的至少一者；当所述胜任力度量和所述经验度量中的至少一者高于建立的最小允许值时，维持对所述自主系统的胜任力操作控制；以及当所述胜任力度量和所述经验度量中的至少一者低于所述建立的最小允许值时，生成警报。2.根据权利要求1所述的系统，其中，所述一个或更多个处理器还执行以下操作：确定经验深度估计结果，所述经验深度估计结果表示在以任务目标为条件的已学习潜在空间中的任何点处的访问密度。3.根据权利要求1所述的系统，其中，所述胜任力度量是基于受试者
‑
操作者特性(ROC)曲线的胜任力度量。4.根据权利要求1所述的系统，其中，所述一个或更多个处理器还执行以下操作：当所述胜任力度量和所述经验度量中的至少一者低于所述建立的最小允许值时，启动将对所述自主系统的控制移交给人类用户。5.根据权利要求1所述的系统，其中，所述一个或更多个处理器还执行以下操作：当所述胜任力度量和所述经验度量中的至少一者低于所述建立的最小允许值时，启动将控制从人类用户移交给辅助系统。6.根据权利要求1所述的系统，其中，所述自主系统是自主驾驶系统。7.一种对自主系统进行安全且有效的超控的计算机实现的方法，所述方法包括以下动作：使一个或更多个处理器执行在非暂时性计算机可读介质上编码的指令，使得在执行时，所述一个或更多个处理器执行以下操作：提取表示情境的多个语义概念；将所述自主系统采取的动作与在所述情境中采取所述动作时激活的语义概念集合相关联；使用所述自主系统的性能的任务特定奖励函数，测量在所述情境中采取的所述动作的结果并生成奖励度量；将表示所述情境的所述多个语义概念连同在所述情境中采取的所述动作和所述奖励
度量一起存储为记忆；基于所述记忆的回忆生成前瞻性模拟结果；基于所述前瞻性模拟结果，确定表示所述自主系统在所述情境中的胜任力的胜任力度量和表示所述自主系统在所述情境中的经验的经验度量中的至少一者；当所述胜任力度量和所述经验度量中的至少一者高于建立的最小允许值时，维持对所述自主系统的胜任力操作控制；以及当所述胜任力度量和所述经验度量中的至少一者低于所述建立的最小允许值时，生成警报。8.根据权利要求7所述的方法...

【专利技术属性】
技术研发人员：P，
申请(专利权)人：赫尔实验室有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人