用于运载工具的方法、用于运载工具的系统和存储介质技术方案

技术编号：36975675 阅读：11 留言：0更新日期：2023-03-25 17:55

本发明专利技术提供用于运载工具的方法、用于运载工具的系统和存储介质，其用于学习以识别自主运载工具的安全苛求场景。接收表示驾驶场景的第一状态的第一状态信息。信息包括运载工具的状态和运载工具的环境中的智能体的状态。利用神经网络处理第一状态信息以确定智能体要进行的包括感知劣化动作的至少一个动作，该感知劣化动作使得运载工具的感知系统对智能体进行误感知。在进行至少一个动作之后接收表示驾驶场景的第二状态的第二状态信息。确定对动作的奖励。确定并比较运载工具和智能体之间的第一距离和第二距离，以确定对至少一个动作的奖励。基于该奖励来调整神经网络的至少一个权重。重。重。

全部详细技术资料下载

【技术实现步骤摘要】
用于运载工具的方法、用于运载工具的系统和存储介质

[0001]本专利技术涉及用于运载工具的方法、系统和存储介质。

技术介绍

[0002]自主运载工具(AV)的开发包括识别准确捕获在AV的运行包络(operational envelope)之外的感知劣化的场景的挑战。例如，在AV的运行包络的边缘处，可能存在没有在用于控制AV操作的软件中建模的场景。例如，使用所识别的场景来改进AV围绕可能对AV或其(一个或多个)占用者产生安全问题的其它对象的导航。感知劣化的示例是对象闪烁，在对象闪烁中，当AV朝向对象移动时，该对象可能在另一对象后面暂时“消失”。例如，对象闪烁适用于在朝向AV正在操作和/或接近的行驶车辆的小汽车后面步行的行人。

技术实现思路

[0003]一种用于运载工具的方法，包括：使用至少一个处理器，接收表示驾驶场景的第一状态的第一状态信息，所述第一状态信息包括所述运载工具的状态和所述运载工具的环境中的智能体的状态；使用所述至少一个处理器，利用神经网络处理所述第一状态信息以确定所述智能体要进行的至少一个动作，所述至少一个动作包括使得所述运载工具的感知系统对所述智能体进行误感知的感知劣化动作；使用所述至少一个处理器，在所述智能体进行所述至少一个动作之后，接收表示所述驾驶场景的第二状态的第二状态信息；使用所述至少一个处理器，确定对所述至少一个动作的奖励，包括：基于所述第一状态信息来确定处于所述第一状态的所述运载工具和所述智能体之间的第一距离，基于所述第二状态信息来确定处于所述第二状态的所述运载工具和所述智能...

【技术保护点】

【技术特征摘要】
1.一种用于运载工具的方法，包括：使用至少一个处理器，接收表示驾驶场景的第一状态的第一状态信息，所述第一状态信息包括所述运载工具的状态和所述运载工具的环境中的智能体的状态；使用所述至少一个处理器，利用神经网络处理所述第一状态信息以确定所述智能体要进行的至少一个动作，所述至少一个动作包括使得所述运载工具的感知系统对所述智能体进行误感知的感知劣化动作；使用所述至少一个处理器，在所述智能体进行所述至少一个动作之后，接收表示所述驾驶场景的第二状态的第二状态信息；使用所述至少一个处理器，确定对所述至少一个动作的奖励，包括：基于所述第一状态信息来确定处于所述第一状态的所述运载工具和所述智能体之间的第一距离，基于所述第二状态信息来确定处于所述第二状态的所述运载工具和所述智能体之间的第二距离，以及将所述第一距离和所述第二距离进行比较以确定对所述至少一个动作的奖励，其中在所述第二距离与所述第一距离相符的情况下所述奖励更大；以及使用所述至少一个处理器，基于对所述至少一个动作的奖励来调整所述神经网络的至少一个权重。2.根据权利要求1所述的方法，还包括：使用驾驶模型处理所述第一状态信息以确定所述运载工具要进行的至少一个动作，其中所述第二状态信息表示在所述运载工具进行所述至少一个动作之后的所述驾驶场景的第二状态。3.根据权利要求1所述的方法，还包括：确定为处于所述第二状态的所述运载工具和所述智能体之间的第二距离小于阈值距离；以及响应于确定为所述第二距离小于所述阈值距离，基于所述驾驶场景、所述第一状态信息和所述第二状态信息其中至少之一来生成针对驾驶模型的测试。4.根据权利要求1至3中任一项所述的方法，其中，所述神经网络包括长短期记忆即LSTM，以及其中，所述第一状态信息表示所述第一状态和在所述第一状态之前发生的至少一个状态。5.根据权利要求1至4中任一项所述的方法，还包括：响应于包括所述感知劣化动作的所述至少一个动作而减少对所述智能体所进行的未来感知劣化动作的未来奖励。6.根据权利要求1至5中任一项所述的方法，其中，确定对所述至少一个动作的奖励还包括：接收指示在所述驾驶场景的先前执行期间所述运载工具和所述智能体之间的所记录的最低距离的信息；将所述第二距离和针对所述驾驶场景的所记录的最低距离进行比较；以及响应于确定为所述第二距离小于所记录的最低距离而增加对所述至少一个动作的奖励。
7.根据权利要求6所述的方法，还包括：响应于确定为所述第二距离小于所记录的最低距离，在所述至少一个动作之前增加对所述驾驶场景中的所述智能体所进行的各个动作的奖励。8.根据权利要求1至7中任一项所述的方法，其中，确定对所述至少一个动作的奖励还包括：接收指示在所述驾驶场景的先前执行期间处于所述第一状态的所述智能体所采取的先前动作的信息；将所述智能体所进行的所述至少一个动作和所述先前动作进行比较，以确定所述至少一个动作和所述先前动作之间的相异度度量；以及基于所述相异度度量来确定所述奖励，其中，在所述相异度度量指示在所述至少一个动作和所述先前动作之间存在较大相异度的情况下所述奖励更大。9.根据权利要求1至8中任一项所述的方法，其中，确定对所述至少一个动作的奖励还包括：确定在处于所述第一状态的所述智能体和所述运载工具的遮挡点之间的第一遮挡距离；确定在处于所述第二状态的所述智能体和所述运载工具的遮挡点之间的第二遮挡距离；以及将所述第一遮挡距离和所述第二遮挡距离进行比较以确定对所述至少一个动作的奖励，其中，在所述第二遮挡距离小于所述第一遮挡距离的情况下所述奖励更大。10.根据权利要求1至9中任一项所述的方法，其中，所述感知劣化动作包括所述运载工具的感知系统对所述智能体的遗漏感知、所述运载工具的感知系统对所述智能体的误分类、或所述运载工具的感知系统对所述智能体的一个或多个特征的误表征。11.一种非暂时性计算机可读存储介质，其包括在由至少一个处理器执行时使所述至少一个处理器进行操作的指令，所述操作包括：接收表示驾驶场景的第一状态的第一状态信息，所述第一状态信息包括运载工具的状态和所述运载工具的环境中的智能体的状态；利用神经网络处理所述第一状态信息以确定所述智能体要进行的至少一个动作，所述至少一个动作包括使得所述运载工具的感知系统对所述智能体进行误感知的感知劣化动作；在所述智能体进行所述至少一个动作之后，接收表示所述驾驶场景的第二状态的第二状态信息；确定对所述至少一个动作的奖励，包括：基于所述第一状态信息来确定处于所述第一状态的所述运载工具和所述智能体之间的第一距离，基于所述第二状态信息来确定处于所述第二状态的...

【专利技术属性】
技术研发人员：詹姆斯，
申请(专利权)人：动态AD有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人