一种基于微分博弈的人机共享跟踪控制方法技术

技术编号:38871235 阅读:21 留言:0更新日期:2023-09-22 14:07
本发明专利技术涉及机器人跟踪控制技术领域,公开了一种基于微分博弈的人机共享跟踪控制方法,包括:建立人机微分博弈模型;估计人类控制策略及目标函数参数;设计机器人共享控制策略;对机器人所确定的共享控制策略,实现人机共享跟踪控制;本发明专利技术运用微分动态博弈建模人类参与者与机器人之间的动态协商关系,使机器人在博弈框架下通过估计人类消除跟踪误差的意愿调整自己的意愿,并在此基础上设计机器人跟踪控制策略;进一步地,本发明专利技术考虑了人机协作安全性,设计基于控制障碍函数的机器人安全控制策略,使其能够与机器人跟踪控制策略一起,实现安全共享控制。现安全共享控制。现安全共享控制。

【技术实现步骤摘要】
一种基于微分博弈的人机共享跟踪控制方法


[0001]本专利技术涉及机器人跟踪控制
,具体涉及一种基于微分博弈的人机共享跟踪控制方法。

技术介绍

[0002]随着视觉、5G通信、AI等智能技术的发展,机器人逐步应用于智慧工厂、物流仓储等场景中协助人类操作者完成复杂或繁重的任务。如何充分发挥人类在感知和决策方面的天然优势以及机器人重复执行高精度控制任务的优势,是实现自然高效人机交互的关键。为此,机器人需要识别人类操作者的运动意图,并据此给予适时适量的辅助。这其中的关键科学问题之一就是建立人类与机器人之间的交互关系。大多现有的人机系统模型方法并未充分考虑人类操作者与机器人之间的相互适应性,不能很好地刻画人机之间地动态协商关系。
[0003]此外,在人

机共享作业空间下,人机协作的安全性是人机协同控制的前沿与热点。由于人类可能存在疏忽且工作环境可能存在某些紧急情况,人类操作者的命令并不总是安全的。此时,希望机器人能够自主识别环境的不安全性,并暂时违反人类命令以确保人机安全。控制障碍函数(Control Barrier 本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于微分博弈的人机共享跟踪控制方法,包括以下步骤:步骤A,建立人机微分博弈模型:构建与人类具有物理接触交互的二自由度的机械臂模型,得到人机系统模型,人机系统模型为具有两个控制输入的仿射非线性系统,两个控制输入分别为人机系统模型中人类的控制输入u1(t)和人机系统模型中机器人的控制输入u2(t);通过期望的有界参考轨迹和机器人t时刻的轨迹跟踪误差定义增广系统状态ξ(t),并根据人机系统模型和参考轨迹演化,构建人机增广系统模型以最小控制能量实现轨迹跟踪为目标构建人类目标函数J1(ξ(0),u1),以最小控制能量辅助人类实现轨迹跟踪为目标构建机器人目标函数J2(ξ(0),u2);步骤B,估计人类控制策略及目标函数参数:根据Nash均衡策略的性质,对估计的人类控制策略进行建模,并通过对人类目标函数的参数θ1进行估计;步骤C,设计机器人共享控制策略:根据最优控制原理设计机器人跟踪控制策略u
2,t
(t),根据控制障碍函数设计机器人安全控制策略u
2,s
(t),结合机器人跟踪控制策略和安全控制策略,得到机器人共享控制策略u2(t)=u
2,t
(t)+u
2,s
(t),机器人共享控制策略即所述人机系统模型中机器人的控制输入;步骤D:对机器人施加步骤C所确定的共享控制策略u2(t),实现人机共享跟踪控制。2.根据权利要求1所述的基于微分博弈的人机共享跟踪控制方法,其特征在于,二自由度的机械臂包括两根串联的连杆,远离末端执行器的连杆为连杆一,靠近末端执行器的连杆为连杆二;步骤A中,构建与人类具有物理接触交互的二自由度的机械臂模型,得到人机系统模型时:人机系统模型为:式中q(t)=[q1(t) q2(t)]
T
表示机械臂t时刻的角位置向量,q1(t)表示连杆一在t时刻的角位置,q2(t)表示连杆二在t时刻的角位置,表示机械臂在t时刻的角速度向量,表示q1(t)的时间导数,表示q2(t)的时间导数,表示机械臂在t时刻的角加速度向量,M(q(t))表示机械臂在t时刻的惯性矩阵,表示机械臂在t时刻的离心力和科里奥利力矩阵,G(q(t))表示机械臂在t时刻的重力效应矩阵,τ(t)表示在t时刻机械臂力矩,f(t)表示人与机械臂间在t时刻的交互力;令表示机械臂角位置和角速度的增广向量,将人机系统模型构建为:式中,表示z(t)的时间导数,表示人机系统模型偏移动力学,表示人机系统输入动力学,人机系统模型中人类的控制输入u1(t)=f(t),人机系统模型中机器人的控制输入u2(t)=τ(t),M
‑1(q(t))表示M(q(t))的逆矩阵。3.根据权利要求2所述的基于微分博弈的人机共享跟踪控制方法,其特征在于,步骤A
中,构建人机增广系统模型时:用z
d
(t)表示期望的有界参考轨迹,z
d
(t)的导数满足:式中表示z
d
(t)的时间导数,f
d
(z
d
(t))为关于z
d
(t)的利普希茨连续的函数且满足f
d
(0)=0;定义增广系统状态为ξ(t)=[e(t)
T z
d
(t)
T
]
T
,其中e(t)=z(t)

z
d
(t)表示机器人t时刻的轨迹跟踪误差,根据人机系统模...

【专利技术属性】
技术研发人员:秦家虎李曼张聪马麒超刘轻尘
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1