当前位置: 首页 > 专利查询>中山大学专利>正文

基于多模态问答大模型的持镜机器人控制方法及系统技术方案

技术编号:42807383 阅读:14 留言:0更新日期:2024-09-24 20:50
本申请公开了基于多模态问答大模型的持镜机器人控制方法及系统,涉及机器人控制技术领域,方法包括:获取持镜机器人拍摄得到的图像;利用经过预先训练的多模态问答大模型获取图像对应的目标坐标;确定图像中器械尖端的坐标作为当前坐标,确定当前坐标与目标坐标之间的坐标误差;获取持镜机器人的当前关节角,根据当前关节角计算得到持镜机器人的当前末端位姿;根据坐标误差和当前末端位姿确定目标坐标对应的目标末端位姿;将目标末端位姿发送到持镜机器人,持镜机器人根据目标末端位姿进行轨迹规划并运动。可准确获取图像中器械尖端的当前坐标,利用多模态问答大模型准确预测目标坐标,根据坐标误差驱动持镜机器人,实现精准跟踪和稳定控制。

【技术实现步骤摘要】

本申请涉及机器人控制,尤其涉及基于多模态问答大模型的持镜机器人控制方法及系统


技术介绍

1、操作者通过设置于持镜机器人末端的关节镜可以观察操作区域,部分操作场景下,操作空间非常狭小,需要协同使用多种器械工具,因此需要持续精准调整关节镜的位置,以实时调整关节镜观察的视野。然而,相关技术的持镜机器人仍存在视野跟踪不准确、不稳定的问题。


技术实现思路

1、本申请实施例的主要目的在于提出基于多模态问答大模型的持镜机器人控制方法及系统,以提高持镜机器人的跟踪精度和稳定性。

2、为实现上述目的,本申请实施例的一方面提出了基于多模态问答大模型的持镜机器人控制方法,所述方法包括以下步骤:

3、获取持镜机器人拍摄得到的图像;

4、利用经过预先训练的多模态问答大模型获取所述图像对应的目标坐标;

5、确定所述图像中器械尖端的坐标作为当前坐标,并确定所述当前坐标与所述目标坐标之间的坐标误差;

6、获取所述持镜机器人的当前关节角,并根据所述当前关节角计算得到所述持镜机器人的本文档来自技高网...

【技术保护点】

1.基于多模态问答大模型的持镜机器人控制方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的基于多模态问答大模型的持镜机器人控制方法,其特征在于,所述利用经过预先训练的多模态问答大模型获取所述图像对应的目标坐标,包括以下步骤:

3.根据权利要求2所述的基于多模态问答大模型的持镜机器人控制方法,其特征在于,在所述利用经过预先训练的多模态问答大模型获取所述图像对应的目标坐标之前,所述方法还包括训练所述多模态问答大模型的步骤,所述训练所述多模态问答大模型的步骤包括:

4.根据权利要求1所述的基于多模态问答大模型的持镜机器人控制方法,其特征在于,...

【技术特征摘要】

1.基于多模态问答大模型的持镜机器人控制方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的基于多模态问答大模型的持镜机器人控制方法,其特征在于,所述利用经过预先训练的多模态问答大模型获取所述图像对应的目标坐标,包括以下步骤:

3.根据权利要求2所述的基于多模态问答大模型的持镜机器人控制方法,其特征在于,在所述利用经过预先训练的多模态问答大模型获取所述图像对应的目标坐标之前,所述方法还包括训练所述多模态问答大模型的步骤,所述训练所述多模态问答大模型的步骤包括:

4.根据权利要求1所述的基于多模态问答大模型的持镜机器人控制方法,其特征在于,所述确定所述图像中器械尖端的坐标作为当前坐标,包括以下步骤:

5.根据权利要求1所述的基于多模态问答大模型的持镜机器人控制方法,其特征在于,所述根据所述坐标误差和所述...

【专利技术属性】
技术研发人员:彭键清魏富鑫杨梓杰陈宁宁佘鹏张鹏辉
申请(专利权)人:中山大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1