【技术实现步骤摘要】
基于强化学习的机器人控制器及动力学模型不确定参数辨识方法
[0001]本专利技术涉及机器人动力学模型参数辨识
,具体涉及基于强化学习的机器人控制器及动力学模型不确定参数辨识方法。
技术介绍
[0002]柔性动力学模型可用于描述力学性能,其中参数辨识迄今仍是一个悬而未决的问题。最广泛应用的识别方法之一是逆动力学识别模型最小二乘法,其中将未知参数分组到最小参数集,然后使用最小二乘准则来估计基于激励实验的参数。在此基础上,进行微小的调整,使用不同的估计方法,如卡尔曼滤波和最大似然估计。另外,机器学习也用于参数识别。例如用于动力学识别的改进布谷鸟搜索算法,非线性回归器来识别达芬奇机器人的参数。然而,这些方法都是面向最小参数集,不能独立获取每个参数,限制了模型应用的灵活性。
[0003]有鉴于此,本专利技术提供基于强化学习的机器人控制器及动力学模型不确定参数辨识方法,以解决现有技术存在的不足,是非常有必要的。
技术实现思路
[0004]针对现有技术存在的不足,本专利技术提供基于强化学习的机器人控制器及动力 ...
【技术保护点】
【技术特征摘要】
1.基于强化学习的机器人控制器及动力学模型不确定参数辨识方法,其特征在于,包括以下步骤:S1.初步获得动力学参数;S2.使用强化学习方法进行动力学参数调整;2.根据权利要求1所述的基于强化学习的机器人动力学模型不确定参数辨识方法,其特征在于,所述步骤S1中初步获得的动力学参数是根据手册及CAD模型计算获得,称为参数初始值。3.根据权利要求1所述的基于强化学习的机器人动力学模型不确定参数辨识方法,其特征在于,所述步骤S2中强化学习方法为连续动作强化学习自动机。4.根据权利要求1所述的基于强化学习的机器人动力学模型不确定参数辨识方法,其特征在于,所述步骤S2中使用强化学习方法进行动力学参数调整,具体步骤为:Step1:初始化待辨识参数的学习空间;Step2:基于机器人动力学模型定义损失函数;Step3:激发机器人动力学特性生成训练集;Step4:使用连续动作自动强化学习自动机调整参数;5.根据权利要求4所述的基于强化学习的机器人动力学模型不确定参数辨识方法,其特征在于,所述步骤Step1中初始化待辨识参数的学习空间,假设动力学模型参数集为X={x
i
|i=1,2,...,m}其中x
i
表示第i个独立参数,需要确定xi的一个学习空间范围[x...
【专利技术属性】
技术研发人员:倪鹤鹏,邓金栋,姬帅,叶瑛歆,胡天亮,高晓明,张承瑞,吴乐,
申请(专利权)人:山东建筑大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。