【技术实现步骤摘要】
一种基于深度强化学习和阻抗控制的柔顺人机接触方法
[0001]本专利技术涉及柔顺控制
,具体涉及一种基于深度强化学习和阻抗控制的柔顺人机接触方法。
技术介绍
[0002]近年来,随着人工智能技术的进步,机器人的感知能力和交互沟通能力越来越强,作为一个模拟人类行为的机器系统,智能机器人能够协助人类完成各式各样的任务,相互之间的接触也不可避免的发生,为实现人与机器人的紧密结合,“人机共融”成为了重要的发展趋势。在这种趋势下,对机器人操作水平的要求也越来越高。在机器人的位置控制和力控方面,传统的柔顺控制技术已经发展得非常成熟。但控制系统的设计依托于精确的数学模型,而在柔顺人机接触任务中,由于环境的复杂性、时变性以及不确定性,很难得到精确的数学模型。因此,传统控制技术在处理相应任务时仍存在一定的挑战和局限性。
技术实现思路
[0003]本专利技术为了克服以上技术的不足,提供了一种基于深度强化学习和阻抗控制的柔顺人机接触方法。
[0004]本专利技术克服其技术问题所采用的技术方案是:
[0005]一种基于深度强化学习和阻抗控制的柔顺人机接触方法,包括如下步骤:
[0006]a)根据柔顺人机接触任务,以机械臂底座建立机械臂坐标系,获得执行器的初始位置坐标{P
x
,P
y
,P
z
}及目标部位在机械臂坐标系下的位置坐标{O
x
,O
y
,O
z
},P
x
为执行器的X ...
【技术保护点】
【技术特征摘要】
1.一种基于深度强化学习和阻抗控制的柔顺人机接触方法,其特征在于,包括如下步骤:a)根据柔顺人机接触任务,以机械臂底座建立机械臂坐标系,获得执行器的初始位置坐标{P
x
,P
y
,P
z
}及目标部位在机械臂坐标系下的位置坐标{O
x
,O
y
,O
z
},P
x
为执行器的X轴坐标,P
y
为执行器的Y轴坐标,P
z
为执行器的Z轴坐标,O
x
为目标部位的X轴坐标,O
y
为目标部位的Y轴坐标,O
z
为目标部位的Z轴坐标;b)通过深度强化学习算法建立状态空间S和动作空间A,S={P
′
x
,P
′
y
,P
′
z
,O
x
,O
y
,O
z
,F
x
,F
y
,F
z
},式中F
x
为执行器的X轴方向上的接触力分力,F
y
为执行器的Y轴方向上的接触力分力,F
z
为执行器的Z轴方向上的接触力分力,P
′
x
为执行器的实时位置的X轴坐标,P
′
y
为执行器的实时位置的Y轴坐标,P
′
z
为执行器的实时位置的Z轴坐标;c)对机械臂位姿进行初始化,初始化后执行器的实时位置坐标为{P
′
x
,P
′
y
,P
′
z
},得到执行器初始位置与目标部位之间的距离d
i
及执行器当前位置与目标部位之间的距离d
c
;d)通过公式r1=(d
i
‑
d
c
)/d
i
计算得到基于距离的奖励函数r1;e)设定柔顺人机在接触任务中,执行器与目标接触的接触力在m
‑
nN之内;f)在距离身体距离为γ处设置虚拟接触面;g)通过公式l=|P
′
z
‑
O
z
|计算得到是否接触到虚拟接触面的判定条件值l;h)当l>γ时,判定执行器未接触到虚拟接触面,状态空间F
x
,F
y
,F
z
均为0;i)当0<l≤γ时,判定执行器接触到虚拟接触面,此时通过阻抗控制得到虚拟接触力F
v
,F
v
=(F
x
′
,F
y
′
,F
z
′
)
T
,F
x
′
为执行器的X轴方向上的虚拟接触力分力,F
y
′
为执行器的Y轴方向上的虚拟接触力分力,F
z
′
为执行器的Z轴方向上的虚拟接触力分力,T为转置,将F
x
′
、F
y
′
及F
z
′
分别等同于状态空间S中的F
x
、F
y
及F
z
;j)当执行器与身体发生接触时,真实接触力F
e
≠0,此时停止对执行器的控制。2.根据权利要求1所述的基于深度强化学习和阻抗...
【专利技术属性】
技术研发人员:舒明雷,张铁译,陈超,王若同,刘照阳,
申请(专利权)人:齐鲁工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。