从机器人系统和应用的复杂指令中解译离散任务技术方案

技术编号：38870262 阅读：10 留言：0更新日期：2023-09-22 14:07

本公开涉及从机器人系统和应用的复杂指令中解译离散任务。提供了用于执行复杂(例如，复合)任务的方法，所述复杂任务可涉及多个离散任务，所述多个离散任务在执行所述复杂任务的指令中并不明显。可以使用捕获的图像数据来确定环境的条件集，并且分析所述指令以确定在执行所述指令之后存在于所述环境中的最终条件集。这些初始条件和结束条件用于确定要执行的离散任务序列，以使机器人或自动化设备执行所述指令。这可以涉及在至少一些实施例中使用符号或视觉规划器，以及搜索可用于所述机器人或自动化设备的可能的动作序列。可以使机器人执行所述离散任务序列，以及提供反馈使得所述任务序列可以被酌情修改。任务序列可以被酌情修改。任务序列可以被酌情修改。

全部详细技术资料下载

【技术实现步骤摘要】
从机器人系统和应用的复杂指令中解译离散任务

[0001]本公开涉及从机器人系统和应用的复杂指令中解译离散任务。

技术介绍

[0002]机器人和其他自动化设备越来越多地用于协助执行各种任务。然而，为了让机器人能够协助人类完成复杂(complex)的任务或目标，这些机器人需要能够解译给出的关于这些复杂任务的指令。人类语言可能复杂、模糊、难以理解，而且也可能并不明显，从复杂任务或目标的描述来看，为了完成整体、更复杂的任务或实现长期目标，需要执行哪些单独的子任务或动作。例如，诸如“从抽屉里抓取一把刀”之类的指令没有明确指定是哪把刀或哪个抽屉，也没有明确指定抓取一把刀后如何处理。如果在场景中有多个抽屉和多把刀，机器人需要推理出哪个抽屉应该包含一把刀，以及要取出哪把刀。此外，在一个抽屉里可能是日常刀具，而在另一个抽屉里可能是牛排刀具或雕刻刀具，而机器人必须能够推理出哪个动作会满足指令。

技术实现思路

[0003]在一个方面，提供了一种计算机实现的方法。所述方法包括：接收音频数据，所述音频数据与执行复合任务的口头请求相对应，所述复合任务涉及待执行的未指定的多个离散任务；分析所述音频数据以生成所述口头请求的文本表示；获取图像数据，所述图像数据表示环境的当前状态，所述复合任务要在所述环境中执行；分析所述图像数据以获取用于所述环境的所述当前状态的当前条件集，以及分析所述口头请求的所述文本表示以获取在执行所述复合任务之后的所述环境的期望条件集；至少部分地基于可执行动作集，确定待被执行以从所述当前条件集转变到所述环境的所述期...

【技术保护点】

【技术特征摘要】
1.一种计算机实现的方法，包括：接收音频数据，所述音频数据与执行复合任务的口头请求相对应，所述复合任务涉及待执行的未指定的多个离散任务；分析所述音频数据以生成所述口头请求的文本表示；获取图像数据，所述图像数据表示环境的当前状态，所述复合任务要在所述环境中执行；分析所述图像数据以获取用于所述环境的所述当前状态的当前条件集，以及分析所述口头请求的所述文本表示以获取在执行所述复合任务之后的所述环境的期望条件集；至少部分地基于可执行动作集，确定待被执行以从所述当前条件集转变到所述环境的所述期望条件集的离散任务序列；以及使所述离散任务序列的指令被执行以执行所述复合任务。2.根据权利要求1所述的方法，其中所述复合任务将使用机器人设备来执行，以及其中所述可执行动作集至少部分地使用所述机器人设备的类型来确定。3.根据权利要求1所述的方法，进一步包括：使用基于树的搜索来确定所述离散任务序列，其中所述树的至少一个分支包括至少部分地基于相应条件子集被满足而选择的可执行动作的子集。4.根据权利要求3所述的方法，其中所述序列是被选择用于最小化所述复合任务的执行成本的多个候选序列中的一者。5.根据权利要求1所述的方法，其中所述当前条件集是基于使用所述图像数据针对在所述环境中检测到的对象而生成的分割掩码集来确定的。6.根据权利要求1所述的方法，其中所述当前条件集是至少部分地基于识别在所述环境中使用所述图像数据表示的对象集来确定的。7.根据权利要求1所述的方法，进一步包括：在执行所述复合任务期间监测所述环境的状态；以及至少部分地基于所述环境的变化来调整所述离散任务序列。8.根据权利要求1所述的方法，进一步包括：将所述图像数据编码到潜在空间中以被提供作为神经网络的输入，其中分析所述图像数据包括使用所述神经网络来分析所述图像数据，以获取针对所述环境的所述当前状态的所述当前条件集中的至少一个当前条件。9.根据权利要求1所述的方法，进一步包括：生成表示所述环境的所述当前条件集和所述期望条件集的符号集，其中所述离散任务序列是使用所述符号集来确定的。10.一种系统，包括：语言模型，用于将口头指令转换为复合任务的文本表示；图像模型，用于确定视觉特征集，所述视觉特征集与在环境图像中表示的对象相对应，所述复合任务要在所述环境中执行；任务规划器，用于至少部分地基于所述文本表示、所述视觉特征集和可执行动作集来确定要为所述复合任务执行的离散任务序列；以及执行模块，用于使所述离散任务序列的指令被执行。
11.根据权利要求10所述的系统，其中所述复合任务使用机器人设备执行...

【专利技术属性】
技术研发人员：C，
申请(专利权)人：辉达公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人