当前位置: 首页 > 专利查询>罗伯特专利>正文

用于控制代理的方法技术

技术编号:37356082 阅读:28 留言:0更新日期:2023-04-27 07:06
按照各种实施方式,描述了一种用于控制代理的方法,该方法具有:借助于训练数据来训练神经网络,这些训练数据对于多个代理来说包含这些代理的行为的示例,其中该神经网络的输出具有针对行为的预测并且取决于网络参数,这些网络参数针对所有训练数据来共同被训练,并且该神经网络的输出取决于另一参数,该另一参数针对所述多个代理中的每个代理来单独训练;将概率分布拟合到针对这些代理的该另一参数的从训练中得到的值;在代理的环境中对来自另一代理的概率分布中的值进行采样;而且在考虑该神经网络针对该另一代理的经采样的值所输出的该另一代理的行为的预测的情况下控制该代理。理。理。

【技术实现步骤摘要】
用于控制代理的方法


[0001]本公开涉及用于控制代理的方法。

技术介绍

[0002]在自主系统领域,对受控代理(诸如机器人)的环境中的移动对象(例如人员)的行为的预测是一项重要任务,以便可靠地控制该代理并且例如避免碰撞。
[0003]尤其是,对在为一至10秒的不久的将来的人类行为的预测是一项基本任务。例如,医院机器人必须预测护士、医生和患者的行为,以便及时在走廊为他们腾出空间。在自主驾驶中,车辆必须预见到其他交通成员的介入。目前最准确的预测方法几乎无一例外地属于机器学习的范畴。
[0004]这项任务的挑战之一是人类行为取决于个人愿望、偏好和意图并且因而可能采取多种形式。例如,一个驾驶员不喜欢超越较慢的前车并且作为替代对速度进行适配,而另一个驾驶员不想浪费时间并且更喜欢超车。现在,为了准确的预测,该行为范围必须被覆盖并且在机器学习方法的情况下从数据中被学习。
[0005]为此,目前领先的机器学习方法使用变分自编码器(VAE)方法的变体。这里假设:所要预测的参量不仅取决于输入数据而且取决于遵循先验分布的潜在变量。该参量并不本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于控制代理的方法,所述方法具有:借助于训练数据来训练神经网络,这些训练数据对于多个代理来说包含这些代理的行为的示例,其中该神经网络的输出具有针对行为的预测并且取决于网络参数,这些网络参数针对所有训练数据来共同被训练,并且该神经网络的输出取决于另一参数,该另一参数针对所述多个代理中的每个代理来单独训练;将概率分布拟合到针对这些代理的该另一参数的从训练中得到的值;在代理的环境中对来自另一代理的概率分布中的值进行采样;而且在考虑该神经网络针对该另一代理的经采样的值所输出的该另一代理的行为的预测的情况下控制该代理。2.根据权利要求1所述的方法,其中该神经网络被训练来将该神经网络的输入映射到代理的行为的预测,其中该神经网络的输入包括:该代理的状态信息,该神经网络应该针对该代理来预测该行为;和该另一参数。3.根据权利要求2所述...

【专利技术属性】
技术研发人员:F
申请(专利权)人:罗伯特
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1