一种基于深度强化学习和阻抗控制的柔顺人机接触方法技术

技术编号:34291278 阅读:49 留言:0更新日期:2022-07-27 09:32
一种基于深度强化学习和阻抗控制的柔顺人机接触方法,根据本任务的需求,建立相关的状态空间,动作空间和奖励函数,为实现任务的柔顺性,在身体表面建立虚拟接触面,结合阻抗控制,提前获取执行器到达目标部位的虚拟接触力,并输入状态空间,通过深度强化学习算法对执行器动作的调整,实现力调整,完成任务。实现了深度强化学习和柔顺控制的结合,建立了虚拟接触面,可提前获取执行器的接触力,实现对接触力的调整,来适应复杂多变的柔顺人机接触任务。务。务。

【技术实现步骤摘要】
一种基于深度强化学习和阻抗控制的柔顺人机接触方法


[0001]本专利技术涉及柔顺控制
,具体涉及一种基于深度强化学习和阻抗控制的柔顺人机接触方法。

技术介绍

[0002]近年来,随着人工智能技术的进步,机器人的感知能力和交互沟通能力越来越强,作为一个模拟人类行为的机器系统,智能机器人能够协助人类完成各式各样的任务,相互之间的接触也不可避免的发生,为实现人与机器人的紧密结合,“人机共融”成为了重要的发展趋势。在这种趋势下,对机器人操作水平的要求也越来越高。在机器人的位置控制和力控方面,传统的柔顺控制技术已经发展得非常成熟。但控制系统的设计依托于精确的数学模型,而在柔顺人机接触任务中,由于环境的复杂性、时变性以及不确定性,很难得到精确的数学模型。因此,传统控制技术在处理相应任务时仍存在一定的挑战和局限性。

技术实现思路

[0003]本专利技术为了克服以上技术的不足,提供了一种基于深度强化学习和阻抗控制的柔顺人机接触方法。
[0004]本专利技术克服其技术问题所采用的技术方案是:
[0005]一种基于深度强化学习本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度强化学习和阻抗控制的柔顺人机接触方法,其特征在于,包括如下步骤:a)根据柔顺人机接触任务,以机械臂底座建立机械臂坐标系,获得执行器的初始位置坐标{P
x
,P
y
,P
z
}及目标部位在机械臂坐标系下的位置坐标{O
x
,O
y
,O
z
},P
x
为执行器的X轴坐标,P
y
为执行器的Y轴坐标,P
z
为执行器的Z轴坐标,O
x
为目标部位的X轴坐标,O
y
为目标部位的Y轴坐标,O
z
为目标部位的Z轴坐标;b)通过深度强化学习算法建立状态空间S和动作空间A,S={P

x
,P

y
,P

z
,O
x
,O
y
,O
z
,F
x
,F
y
,F
z
},式中F
x
为执行器的X轴方向上的接触力分力,F
y
为执行器的Y轴方向上的接触力分力,F
z
为执行器的Z轴方向上的接触力分力,P

x
为执行器的实时位置的X轴坐标,P

y
为执行器的实时位置的Y轴坐标,P

z
为执行器的实时位置的Z轴坐标;c)对机械臂位姿进行初始化,初始化后执行器的实时位置坐标为{P

x
,P

y
,P

z
},得到执行器初始位置与目标部位之间的距离d
i
及执行器当前位置与目标部位之间的距离d
c
;d)通过公式r1=(d
i

d
c
)/d
i
计算得到基于距离的奖励函数r1;e)设定柔顺人机在接触任务中,执行器与目标接触的接触力在m

nN之内;f)在距离身体距离为γ处设置虚拟接触面;g)通过公式l=|P

z

O
z
|计算得到是否接触到虚拟接触面的判定条件值l;h)当l>γ时,判定执行器未接触到虚拟接触面,状态空间F
x
,F
y
,F
z
均为0;i)当0<l≤γ时,判定执行器接触到虚拟接触面,此时通过阻抗控制得到虚拟接触力F
v
,F
v
=(F
x

,F
y

,F
z

)
T
,F
x

为执行器的X轴方向上的虚拟接触力分力,F
y

为执行器的Y轴方向上的虚拟接触力分力,F
z

为执行器的Z轴方向上的虚拟接触力分力,T为转置,将F
x

、F
y

及F
z

分别等同于状态空间S中的F
x
、F
y
及F
z
;j)当执行器与身体发生接触时,真实接触力F
e
≠0,此时停止对执行器的控制。2.根据权利要求1所述的基于深度强化学习和阻抗...

【专利技术属性】
技术研发人员:舒明雷张铁译陈超王若同刘照阳
申请(专利权)人:齐鲁工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1