多智能体模拟制造技术

技术编号：33441357 阅读：13 留言：0更新日期：2022-05-19 00:28

方法、系统和装置，包括编码在计算机存储介质上的计算机程序，用于生成多个智能体在多个时间步长上与之交互的环境的模拟，其中该模拟包括每个时间步长的相应模拟状态，所述相应模拟状态指定每个智能体在该时间步长的相应状态。在一个方面，一种方法包括，对于每个时间步长：获得当前时间步长的当前模拟状态；生成下一时间步长的多个候选下一模拟状态；对于每个候选下一模拟状态，确定表征该候选下一模拟状态是真实模拟状态的可能性的鉴别分数；基于候选下一模拟状态的鉴别分数，选择候选下一模拟状态作为下一时间步长的模拟状态。拟状态作为下一时间步长的模拟状态。拟状态作为下一时间步长的模拟状态。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】多智能体模拟

技术介绍

[0001]本说明书涉及使用机器学习模型来模拟环境。
[0002]机器学习模型接收输入并基于接收到的输入生成输出，例如预测输出。一些机器学习模型是参数模型，并基于接收到的输入和基于模型的参数值生成输出。
[0003]一些机器学习模型是深度模型，其采用多层模型来为接收到的输入生成输出。例如，深度神经网络是一种深度机器学习模型，其包括一个输出层和一个或多个隐藏层，每个隐藏层将非线性变换应用于接收到的输入以生成输出。

技术实现思路

[0004]本说明书描述了实现为在一个或多个位置的一个或多个计算机上的计算机程序的模拟系统，该模拟系统可以学习控制与模拟环境交互的一组智能体，以使它们的行为真实地模拟真实世界智能体的行为。
[0005]根据第一方面，提供了一种由一个或多个数据处理装置执行的用于生成一组智能体在时间步长的序列上与之交互的环境的模拟的方法。所述模拟包括每个时间步长的相应模拟状态，所述相应模拟状态指定每个智能体在所述时间步长的相应状态。所述方法包括，对于每个时间步长，获得当前时间步长的当前模拟状态。基于当前模拟状态生成下一时间步长的一组候选下一模拟状态。生成每个候选下一模拟状态包括，对于每个智能体，从能够由所述智能体执行的一组可能动作中采样相应动作。对于每个智能体，确定如果智能体在当前时间步长执行对应的采样动作，则所述智能体在下一时间步长的相应下一状态。对于每个候选下一模拟状态，确定表征所述候选下一模拟状态是真实模拟状态的可能性的鉴别分数。基于候选下一模拟状态的鉴别分数，选...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种由一个或多个数据处理装置执行的用于生成多个智能体在多个时间步长上与之交互的环境的模拟的方法，其中，所述模拟包括每个时间步长的相应模拟状态，所述相应模拟状态指定每个智能体在所述时间步长的相应状态，所述方法包括，对于每个时间步长：获得当前时间步长的当前模拟状态；基于当前模拟状态生成下一时间步长的多个候选下一模拟状态，其中，生成每个候选下一模拟状态包括：对于每个智能体，从能够由所述智能体执行的一组可能动作中采样相应动作；以及对于每个智能体，如果智能体在当前时间步长执行对应的采样动作，则确定所述智能体在下一时间步长的相应下一状态；对于每个候选下一模拟状态，确定表征所述候选下一模拟状态是真实模拟状态的可能性的鉴别分数；以及基于候选下一模拟状态的鉴别分数，选择候选下一模拟状态作为下一时间步长的模拟状态。2.如权利要求1所述的方法，其中，所述智能体是环境中的载具。3.如权利要求2所述的方法，其中，能够由智能体执行的所述一组可能动作包括调整所述智能体的转向角的动作。4.如权利要求2
‑
3中任一项所述的方法，其中，能够由智能体执行的所述一组可能动作包括调整所述智能体的加速度的动作。5.如前述权利要求中任一项所述的方法，其中，智能体在一时间步长的状态包括：(i)所述智能体在所述时间步长的位置，和(ii)所述智能体在所述时间步长的运动。6.如权利要求5所述的方法，其中，所述智能体的位置包括：(i)所述智能体在所述环境中的空间位置，以及(ii)所述智能体在所述环境中的航向。7.如权利要求5
‑
6中任一项所述的方法，其中，所述智能体的运动包括：(i)所述智能体的速度，和(ii)所述智能体的加速度。8.如前述权利要求中任一项所述的方法，还包括，对于每个智能体：获得环境中智能体的当前状态的表示；以及使用策略神经网络处理环境中智能体的当前状态的表示，以生成智能体的所述一组可能动作上的对应概率分布；其中，对于每个智能体，从所述一组可能动作中采样相应动作包括，对于每个智能体：根据智能体的所述一组可能动作上的概率分布，从所述一组可能动作中采样动作。9.如前述权利要求中任一项所述的方法，其中，对于每个智能体，如果智能体在当前时间步长执行对应的采样动作，则确定所述智能体在下一时间步长的相应下一状态包括，对于每个智能体：使用...

【专利技术属性】
技术研发人员：BA怀特，
申请(专利权)人：伟摩有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人