获取用于生成形封闭抓取位姿的控制策略的方法、计算设备和介质技术

技术编号：39286518 阅读：5 留言：0更新日期：2023-11-07 10:57

本申请实施例提供了一种获取用于生成抓取主体对抓取对象的形封闭抓取位姿的控制策略的方法，该方法包括：基于抓取主体与时间步对应的当前位姿和抓取对象构建第一观测向量，第一观测向量表征抓取主体上的点到抓取对象的距离和方向；基于抓取对象与时间步对应的物体代理构建第二观测向量，第二观测向量表征物体代理与抓取主体之间的接触情况，物体代理包括抓取对象的符号距离函数等值面；利用策略网络基于抓取主体的当前位姿、第一观测向量和第二观测向量络输出抓取主体与下一时间步对应的更新位姿，以对策略网络进行训练；以及响应于抓取主体的更新位姿满足对抓取对象的形封闭条件而停止对策略网络的训练，并将经训练的策略网络确定为控制策略。策略网络确定为控制策略。策略网络确定为控制策略。

全部详细技术资料下载

【技术实现步骤摘要】
获取用于生成形封闭抓取位姿的控制策略的方法、计算设备和介质

[0001]本申请涉及人工智能
，尤其涉及一种获取用于生成抓取主体对抓取对象的形封闭抓取位姿的控制策略的方法、计算设备和存储介质。

技术介绍

[0002]抓取生成是计算机图形学、机器人和人机交互的一个重要的研究问题。动画和游戏中的虚拟人物或角色在与周围世界进行交互时经常需要对不同的物体进行抓取，例如，在一些场景中，虚拟人物或角色需要抓取鱼竿、酒杯等物体，这样的抓取动画往往需要大量的人力和物力来手工制作。另一方面，抓取是机器人完成许多任务的基础操作，例如搬运物体或使用工具，而越复杂的任务和对于抓取的要求通常也越高。因此，为给定物体和抓取主体(例如，手部模型或机器人手)生成抓取轨迹和抓取位姿已成为一个重要的研究问题。
[0003]一般而言，抓取生成方法可以被分为三个大类：第一类方法是基于分析的方法，其是通过预先定义的抓取质量指标来辅助抓取的生成和质量的评估，最常见的两种抓取指标是力封闭和形封闭。由于抓取问题本身的复杂性，已有的基于分析的方法普遍存在对于抓取问题过度简化的问题，这使得这类算法不能应用于复杂的手部模型和物体。基于力封闭的方法依赖于具体的摩擦系数，但是摩擦系数在实际运行时很难获取。而基于形封闭的方法目前都无法应用于复杂的物体和手部模型上。第二类方法是基于物理仿真的方法，这类方法会通过诸如摇晃物体、抬高物体的物理仿真测试来评估和生成抓取位姿。这类方法依旧依赖于具体的摩擦系数，并且需要较长的计算时间。第三类方法利用基于深度学习的方式进行抓取生...

【技术保护点】

【技术特征摘要】
1.一种获取用于生成抓取主体对抓取对象的形封闭抓取位姿的控制策略的方法，其特征在于，所述方法包括：基于所述抓取主体与时间步对应的当前位姿和所述抓取对象构建第一观测向量，所述第一观测向量表征所述抓取主体上的点到所述抓取对象的距离和方向；基于所述抓取对象与时间步对应的物体代理构建第二观测向量，所述第二观测向量表征所述物体代理与所述抓取主体之间的接触情况，所述物体代理包括所述抓取对象的符号距离函数等值面；利用策略网络基于所述抓取主体的当前位姿、所述第一观测向量和所述第二观测向量络输出所述抓取主体与下一时间步对应的更新位姿，以使所述策略网络经受训练；以及响应于所述抓取主体的所述更新位姿满足对所述抓取对象的形封闭条件而停止对所述策略网络的训练，并将经训练的策略网络确定为所述控制策略。2.根据权利要求1所述的方法，其中所述基于所述抓取主体与时间步对应的当前位姿和所述抓取对象构建第一观测向量包括：获取抓取对象的多个区域编码，所述多个区域编码分别对应于所述抓取对象的表面上彼此独立的多个区域；以及将处于与所述时间步对应的当前位姿的所述抓取主体上的点的坐标信息和所述多个区域编码提供给第一观测向量获取网络，以获得所述抓取主体上的点到所述多个区域的距离和相应的方向，其中所述第一观测向量获取网络是基于已知的多个空间点和所述多个区域编码预先训练获得的。3.根据权利要求2所述的方法，其中所述第一观测向量获取网络至少通过以下步骤训练获得：提供第一观测向量获取网络的网络模型；基于所述已知的多个空间点和所述多个区域编码，利用所述网络模型输出所述多个空间点到所述抓取对象的表面上彼此独立的多个区域的预测方向和预测距离；根据所述预测方向和所述预测距离更新所述多个空间点的位置，直至针对所述网络模型的损失函数的值小于第一阈值，其中所述损失函数的值指示根据所述预测距离和所述预测方向将所述多个空间点分别投影到所述抓取对象的表面得到的投影点形成的投影区域与所述抓取对象的表面上彼此独立的多个区域中相应的区域的重合度。4.根据权利要求2所述的方法，其中所述获取抓取对象的多个区域编码包括：通过最远点采样从所述抓取对象的表面的点云中确定m个中心点；根据所述m个中心点对所述点云进行维诺图分解，将所述抓取对象的表面分成彼此独立的多个区域；以及对所述多个区域进行编码获得所述多个区域编码，其中m为正整数。5.根据权利要求2所述的方法，其中所述抓取主体上的点到所述抓取对象的距离包括所述抓取主体上的点到所述多个区域中的各个区域的最短距离，所述抓取主体上的点到所述抓取对象的方向包括所述多个区域中的各个区域在所述抓取主体上的点处的符号距离函数的梯度方向。6.根据权利要求1所述的方法，其中所述第二观测向量至少指示所述物体代理上点与
所述抓取主体是否接触，其中基于所述抓取对象与时间步对应的物体代理构建第二观测向量包括：根据每个时间步确定所述抓取主体上与所述抓取对象距离最近的最近点；将所述抓取对象在所述最近点处的符号距离函数等值面确定为所述物体代理；确定所述物理代理上的点与所述抓取主体之间的最小距离；响应于所述最小距离小于第二阈...

【专利技术属性】
技术研发人员：房启航，樊庆楠，陈学霖，董思言，陈宝权，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人