当前位置: 首页 > 专利查询>清华大学专利>正文

一种任务条件自适应机器人轴孔装配方法及装置制造方法及图纸

技术编号:34628860 阅读:19 留言:0更新日期:2022-08-20 09:39
本发明专利技术提出一种任务条件自适应机器人轴孔装配方法及装置,属于人工智能技术应用领域。其中,所述方法包括:获取机器人轴孔装配的任务条件,将所述任务条件输入预设的环境策略函数,得到主动柔顺控制策略参数的修正值;利用所述修正值修正主动柔顺控制策略函数参数,得到修正后的主动柔顺控制策略函数;将机器人轴孔装配的状态参数输入所述修正后的主动柔顺控制策略函数,得到所述机器人对应的装配动作。本发明专利技术在于变化的任务条件下实现了机器人轴孔装配的自适应控制,具有更好的适应性与泛化能力,提高了获得有效环境策略的速度,提升了控制系统在实际条件训练过程中的安全性与稳定性。稳定性。稳定性。

【技术实现步骤摘要】
一种任务条件自适应机器人轴孔装配方法及装置


[0001]本专利技术属于人工智能技术应用领域,特别涉及一种任务条件自适应机器人轴孔装配方法及装置。

技术介绍

[0002]智能制造快速发展的趋势下,机器人自动化装配技术具有巨大的市场需求,随着装配精度与效率需求的不断提高,机器人自动化装配控制技术已经被越来越多的应用在各种装配领域中,如基于力反馈的末端主动柔顺控制方法等,此类方法将机器人转换为一个非刚性系统,能够在机器人与装配环境之间建立柔性交互从而有效提高装配任务的效率与安全性,然而尽管传统机器人末端主动柔顺控制算法已经被用于解决机器人轴孔装配问题,但由于主动柔顺控制维围绕单一装配任务条件设计,依赖操作人员的经验与调试,迁移至不同任务条件下时仍面临难以快速适应的问题。

技术实现思路

[0003]本专利技术的目的是为克服已有技术的不足之处,提出一种任务条件自适应机器人轴孔装配方法及装置。本专利技术在于变化的任务条件下实现了机器人轴孔装配的自适应控制,具有更好的适应性与泛化能力,提高了获得有效环境策略的速度,提升了控制系统在实际条件训练过程中的安全性与稳定性。
[0004]本专利技术第一方面实施例提出一种任务条件自适应机器人轴孔装配方法,包括:
[0005]获取机器人轴孔装配的任务条件,将所述任务条件输入预设的环境策略函数,得到主动柔顺控制策略参数的修正值;
[0006]利用所述修正值修正预设的主动柔顺控制策略函数参数,得到修正后的主动柔顺控制策略函数;
[0007]将机器人轴孔装配的状态参数输入所述修正后的主动柔顺控制策略函数,得到所述机器人对应的装配动作。
[0008]在本专利技术的一个具体实施例中,所述方法还包括:
[0009]执行所述装配动作,获得更新后的所述机器人轴孔装配的状态参数并判定:
[0010]若所述机器人携带轴达到预设的装配目标深度,则装配完成。
[0011]在本专利技术的一个具体实施例中,所述机器人轴孔装配的任务条件从所述任务条件的分布函数中随机选取。
[0012]在本专利技术的一个具体实施例中,所述主动柔顺控制策略函数表达式如下:
[0013]π(a
t
|s
t

π
)
[0014]其中,机器人主动柔顺控制策略函数的输入量为s
t
,s
t
代表在第t个时刻轴孔装配的状态,包括:机器人在第t个时刻的力和扭矩信息以及第t个时刻轴的位置姿态信息其中F
tx
,F
ty
,F
tz
分别为第t个时刻机器人在末端坐标系下受到的沿X,Y,Z轴的力,分别为第t个时刻机器人在末端坐标系下受到的
沿X,Y,Z轴的扭矩,x
t
,y
t
,z
t
分别为第t个时刻轴末端点在工作空间坐标系下的相对于X,Y,Z轴的位置坐标,分别为第t个时刻轴线方向相对于世界坐标系X,Y,Z轴的欧拉角表示的姿态角;
[0015]机器人主动柔顺策略函数的输出量为a
t
,a
t
代表装配过程中第t个时刻的装配动作,其中分别为第t个时刻机器人在末端坐标系下沿X,Y,Z轴的平移运动值,分别为第t个时刻机器人在末端坐标系下绕X,Y,Z轴的旋转运动值,机器人主动柔顺控制策略函数的参数为θ
π
,包括主动柔顺控制策略函数的阻抗信息[K
d
,B
d
,M
d
],其中K
d
,B
d
,M
d
分别为期望的刚度、阻尼与惯性系数。
[0016]在本专利技术的一个具体实施例中,在所述获取机器人轴孔装配的任务参数,将所述参数输入预设的环境策略函数,得到主动柔顺控制策略参数的修正值之前,还包括:
[0017]训练所述环境策略函数;
[0018]所述训练所述环境策略函数包括:
[0019]1)构建机器人轴孔装配的环境策略函数为Π(ω
n
|z
n

Π
),其中环境策略函数的输入量为环境条件z
n
,z
n
代表第n个装配训练回合开始时的任务条件;环境策略函数的输出量为ω
n
,代表第n个装配训练回合的阻抗修正信息[ΔK
n
,ΔB
n
,ΔM
n
],其中,ΔK
n
,ΔB
n
,ΔM
n
分别为第n个装配训练回合中K
d
,B
d
,M
d
的修正值;θ
Π
是环境策略函数的参数;
[0020]2)构建奖励函数r(s
t
),代表观测到状态s
t
时的奖励值;
[0021]设定相对熵约束系数ε;设定机器人主动柔顺控制策略函数参数θ
π
,初始化环境策略函数参数θ
Π

[0022]3)设定环境策略搜索方法的训练周期数k的初始值为1,初始化环境策略搜索样本库D
cps
为空集合;
[0023]4)在训练周期k开始时,设定装配训练回合数n的初始值为1;
[0024]5)在装配训练回合n开始时,根据装配任务条件z的分布函数ρ(z)随机选取任务条件作为第n个装配训练回合的任务条件z
n

[0025]6)将z
n
输入环境策略函数Π(ω
n
|z
n

Π
),输出ω
n

[0026]利用ω
n
修正主动柔顺控制策略函数参数θ
π
得到更新后的主动柔顺控制策略函数参数
[0027][0028]7)机器人携带轴运动到设定的初始位置,设定当前训练回合初始位置对应的时刻t=1;
[0029]8)在当前训练回合的t时刻,获取状态s
t
输入更新后的主动柔顺控制策略函数输出机器人对应动作值a
t

[0030]令机器人执行动作a
t
,机器人携带轴运动至下一位置,在t+1时刻得到新的状态s
t+1
,将s
t+1
输入奖励函数,得到奖励值r(s
t+1
);
[0031]9)根据s
t+1
判断轴是否抵达目标深度D
n
:若抵达,则执行步骤10);若未抵达,则令t=t+1,然后重新返回步骤8);
[0032]10)装配训练回合n结束,计算装配训练回合n内累计奖励值R
n

[0033][0034]将经验样本{z
n

n<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种任务条件自适应机器人轴孔装配方法,其特征在于,包括:获取机器人轴孔装配的任务条件,将所述任务条件输入预设的环境策略函数,得到主动柔顺控制策略参数的修正值;利用所述修正值修正预设的主动柔顺控制策略函数参数,得到修正后的主动柔顺控制策略函数;将机器人轴孔装配的状态参数输入所述修正后的主动柔顺控制策略函数,得到所述机器人对应的装配动作。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:执行所述装配动作,获得更新后的所述机器人轴孔装配的状态参数并判定:若所述机器人携带轴达到预设的装配目标深度,则装配完成。3.根据权利要求1所述的方法,其特征在于,所述机器人轴孔装配的任务条件从所述任务条件的分布函数中随机选取。4.根据权利要求1所述的方法,其特征在于,所述主动柔顺控制策略函数表达式如下:π(a
t
|s
t

π
)其中,机器人主动柔顺控制策略函数的输入量为s
t
,s
t
代表在第t个时刻轴孔装配的状态,包括:机器人在第t个时刻的力和扭矩信息以及第t个时刻轴的位置姿态信息其中F
tx
,F
ty
,F
tz
分别为第t个时刻机器人在末端坐标系下受到的沿X,Y,Z轴的力,分别为第t个时刻机器人在末端坐标系下受到的沿X,Y,Z轴的扭矩,x
t
,y
t
,z
t
分别为第t个时刻轴末端点在工作空间坐标系下的相对于X,Y,Z轴的位置坐标,分别为第t个时刻轴线方向相对于世界坐标系X,Y,Z轴的欧拉角表示的姿态角;机器人主动柔顺策略函数的输出量为a
t
,a
t
代表装配过程中第t个时刻的装配动作,其中分别为第t个时刻机器人在末端坐标系下沿X,Y,Z轴的平移运动值,别为第t个时刻机器人在末端坐标系下绕X,Y,Z轴的旋转运动值,机器人主动柔顺控制策略函数的参数为θ
π
,包括主动柔顺控制策略函数的阻抗信息[K
d
,B
d
,M
d
],其中K
d
,B
d
,M
d
分别为期望的刚度、阻尼与惯性系数。5.根据权利要求4所述的方法,其特征在于,在所述获取机器人轴孔装配的任务参数,将所述参数输入预设的环境策略函数,得到主动柔顺控制策略参数的修正值之前,还包括:训练所述环境策略函数;所述训练所述环境策略函数包括:1)构建机器人轴孔装配的环境策略函数为Π(ω
n
|z
n

Π
),其中环境策略函数的输入量为环境条件z
n
,z
n
代表第n个装配训练回合开始时的任务条件;环境策略函数的输出量为ω
n
,代表第n个装配训练回合的阻抗修正信息[ΔK
n
,ΔB
n
,ΔM
n
],其中,ΔK
n
,ΔB
n
,ΔM
n
分别为第n个装配训练回合中K
d
,B
d
,M
d
的修正值;θ
Π
是环境策略函数的参数;2)构建奖励函数r(s
t
),代表观测到状态s
t
时的奖励值;设定相对熵约束系数ε;设定机器人主动柔顺控制策略函数参数θ
π
,初始化环境策略函数参数θ
Π

3)设定环境策略搜索方法的训练周期数k的初始值为1,初始化环境策略搜索样本库D
cps
为空集合;4)在训练周期k开始时,设定装配训练回合数n的初始值为1;5)在装配训练回合n开始时,根据装配任务条件z的分布函数ρ(z)随机选取任务...

【专利技术属性】
技术研发人员:徐静杨文昊
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1