一种多智能体协同强化学习的灵巧手自适应控制方法及装置制造方法及图纸

技术编号：46612277 阅读：1 留言：0更新日期：2025-10-14 21:10

本申请涉及机器人技术领域，公开了一种多智能体协同强化学习的灵巧手自适应控制方法及装置，其中方法包括：通过物理引擎构建包含多自由度仿生灵巧手和目标物体的模拟环境；基于仿生灵巧手的多指协同运动学特性，生成用于约束各手指动作的联动规则；将每根手指配置为独立智能体，采用多智能体近端策略优化算法结合联动规则对各手指动作进行约束，训练多指协同抓取策略模型；将训练后的协同抓取策略模型部署至实体仿生灵巧手控制系统，通过实时采集传感器数据生成控制指令，并根据控制指令驱动仿生灵巧手执行自适应抓取操作。本申请能够实现仿生灵巧手的多指协同自适应抓取，提高在高自由度场景下抓取的精度、稳定性和对动态环境的适应性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及机器人，具体涉及一种多智能体协同强化学习的灵巧手自适应控制方法及装置。

技术介绍

1、在人形机器人
，仿生灵巧手的自适应抓取控制方法一直是研究热点。现有的灵巧手控制方法主要依赖于精确的运动学和动力学模型来设计控制策略和优化控制参数。然而，当灵巧手具有高自由度(如每指至少三自由度，总计15自由度以上)时，手指间的动态交互变得极为复杂，传统控制模型难以准确描述多指协同的动态行为，导致控制精度和稳定性不足。

2、目前常见的灵巧手控制方法包括集中式控制和关节级分布式控制。集中式控制由于计算复杂度高，响应延迟常超过100ms，难以满足实时性要求，且对动态环境的适应性较差。而关节级分布式控制虽能提升局部响应速度，但缺乏手指级协作机制，无法优化多指间的力分配和运动协调。在高自由度场景下，传统方法因缺乏有效协同约束，容易导致手指间运动干涉，引发碰撞或抓取失败，抓取成功率在非结构化场景下低于70％。此外，强化学习技术在机器人控制中的应用逐渐增多，但标准ppo算法仅针对单智能体，缺乏多智能体协同作业的强化学习训练框架，难以满足多...

【技术保护点】

1.一种多智能体协同强化学习的灵巧手自适应控制方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的多智能体协同强化学习的灵巧手自适应控制方法，其特征在于，所述通过物理引擎构建包含多自由度仿生灵巧手和目标物体的模拟环境，包括：

3.根据权利要求1所述的多智能体协同强化学习的灵巧手自适应控制方法，其特征在于，所述基于所述仿生灵巧手的多指协同运动学特性，生成用于约束各手指动作的联动规则，包括：

4.根据权利要求1所述的多智能体协同强化学习的灵巧手自适应控制方法，其特征在于，所述将每根手指配置为独立智能体，采用多智能体近端策略优化算法结合所述联动规则对各...

【技术特征摘要】

1.一种多智能体协同强化学习的灵巧手自适应控制方法，其特征在于，包括如下步骤：

4.根据权利要求1所述的多智能体协同强化学习的灵巧手自适应控制方法，其特征在于，所述将每根手指配置为独立智能体，采用多智能体近端策略优化算法结合所述联动规则对各手指动作进行约束，训练多指协同抓取策略模型，包括：

5.根据权利要求4所述的多智能体协同强化学习的灵巧手自适应控制方法，其特征在于，所述采用动态共享信息流机制，根据抓取任务阶段动态调整智能体观察空间，包括：

6.根据权利要求1...

【专利技术属性】
技术研发人员：宋纪元，屠尧，李清泉，
申请(专利权)人：人工智能与数字经济广东省实验室深圳，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人