一种机器人目标物体抓取方法、系统、设备及存储介质技术方案

技术编号：39316803 阅读：8 留言：0更新日期：2023-11-12 15:59

本发明专利技术涉及一种机器人目标物体抓取方法，该方法包括：步骤S1、使用大语言模型来解析用户需求，生成针对目标物体的描述模版；步骤S2、将目标物体的描述模版输入至二维视觉定位网络，生成目标物体的二维定位，处理后得到目标物体点云数据；步骤S3、基于目标物体点云数据，采用类级别位姿和尺寸估计网络对目标物体的位姿进行估计；步骤S4、根据目标物体位姿估计结果引导机械臂进行目标物体抓取。与现有技术相比，本发明专利技术具有人机交互效果好、准确性高的优点。优点。优点。

全部详细技术资料下载

【技术实现步骤摘要】
一种机器人目标物体抓取方法、系统、设备及存储介质

[0001]本专利技术涉及机器人抓取
，尤其是涉及一种机器人目标物体抓取方法、系统、设备及存储介质。

技术介绍

[0002]工业领域以及家用机器人领域，机器人目标物体抓取逐渐成为研究的重点。让机器人能够理解语言指令并相应地对视觉感知做出反应一直是机器人研究领域的一个长期目标。
[0003]经过检索，中国专利技术专利申请，公开号为CN113505806A，公开了一种机器人抓取检测方法，该方法采用图像识别方法进行目标物体识别机抓取，人机交互效果不好且识别准确性有待进一步提升。
[0004]因此，亟需设计一种人机交互能力强、识别准确性高的机器人目标物体抓取方法。

技术实现思路

[0005]本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供了一种人机交互能力强、准确性高的机器人目标物体抓取方法、系统、设备及存储介质。
[0006]本专利技术的目的可以通过以下技术方案来实现：
[0007]根据本专利技术的第一方面，提供了一种机器人目标物体抓取方法，该方法包括：
[0008]步骤1、使用大语言模型来解析用户需求，生成针对目标物体描述模版；
[0009]步骤2、将目标物体描述模版输入至二维视觉定位网络，生成目标物体的二维定位，利用相机内参进行反投影处理后得到目标物体点云数据；
[0010]步骤3、基于目标物体点云数据，采用六自由度位姿和尺寸估计网络对目标物体的位姿进行估计；
[0011]步骤...

【技术保护点】

【技术特征摘要】
1.一种机器人目标物体抓取方法，其特征在于，该方法包括：步骤1、使用大语言模型来解析用户需求，生成针对目标物体描述模版；步骤2、将目标物体描述模版输入至二维视觉定位网络，生成目标物体的二维定位，利用相机内参进行反投影处理后得到目标物体点云数据；步骤3、基于目标物体点云数据，采用六自由度位姿和尺寸估计网络对目标物体的位姿进行估计；步骤4、根据目标物体位姿估计结果引导机械臂进行目标物体抓取。2.根据权利要求1所述的一种基于大型语言模型引导的机器人目标物体抓取方法，其特征在于，所述步骤1中使用大语言模型来解析用户需求，生成针对目标物体的描述模版，具体为：首先，通过提示对ChatGPT的角色进行限定，并对机器人工作空间的环境和语义信息进行格式化定义，以及设定任务规则和限制性输出信息的描述；然后，开始和用户进行多轮开方式词汇地交互对话，直至获悉用户的意图，输出用户所需物体的目标描述模版。3.根据权利要求1所述的一种基于大型语言模型引导的机器人目标物体抓取方法，其特征在于，所述步骤2中将目标物体的描述模版输入至二维视觉定位网络，生成目标物体的二位定位，具体为：语音描述描述转化为文本描述，输入文本描述及场景图片至物体二维视觉定位网络生成目标物体的二维定位结果；所述二维定位采用边界框或者分割掩码表示。4.根据权利要求3所述的一种基于大型语言模型引导的机器人目标物体抓取方法，其特征在于，所述步骤2中处理后得到目标物体点云数据，具体为：得到物体边界框或者分割掩码后，相应地截取对应的深度图像，并通过相机内参将这部分深度图片进行反向投影以获得当前区域内对应的三维点云数据，得到目标物体点云数据。5.根据权利要求1所述的一种基于大型语言模型引导的机器人目标物体抓取方法，其特征在于，所述六自由度位姿和尺寸估计网络为类级别...

【专利技术属性】
技术研发人员：付彦伟，林海涛，李一帆，王天宇，
申请(专利权)人：复旦大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人