一种基于RBF神经网络的机械臂控制方法技术

技术编号：20145853 阅读：38 留言：0更新日期：2019-01-19 00:01

本发明专利技术公开了一种基于RBF神经网络的机械臂控制方法，其方法为：步骤一、提供一种机械臂的认知学习模型机理；步骤二、提出一种基于小脑‑基底神经节的行为认知模型和混合学习算法；步骤三、采用人工神经网络和强化学习方法建立一个能使机械臂自主学习的数学模型；步骤四、在Matlab中，建立机械臂仿真实验模型；步骤五、验证基于RBF神经网络的机械臂控制方法。有益效果：不仅适应于机械臂，还可应用在其他机械领域。可在其他控制领域应用。更适用于应用，可以大大减少程序员的工作量。具有自主学习能力的机械臂在未来更具有竞争力。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于RBF神经网络的机械臂控制方法
本专利技术涉及一种机械臂控制方法，特别涉及一种基于RBF神经网络的机械臂控制方法。
技术介绍
目前，机器人赖以发展的基础是智能，在机器人控制系统中，最关键的是学习机制和能力。模拟智能体的学习机制，使机器人可以像生物体一样自动地通过不断地训练学习获取新知识和技能，实现自我完善，是机器人控制领域的热点问题。在实际工程中，机械臂的有效载荷会发生变化，运动期间诸多参数无法实现精确预知，而RBF网络的自适应控制方法具有不需要未知参数的先验知识的优点，比如不需要知道载荷的质量、机械手终端的位置和终端作用物体上的力，因此不用离线训练神经网络。RBF网络也能辨识机器人的模型误差，可以保证闭环的稳定性，也具有高性能的跟踪效果，因此RBF网络对复杂系统的控制能力在机械臂上有很高的实用价值。
技术实现思路
本专利技术的目的是在于提供一种机械臂的认知学习模型，提出一种基于径向基函数网络的小脑-基底神经节操作条件学习算法，使机械臂实现自主学习，从而能够更好地控制机械臂。本专利技术提供的基于RBF神经网络的机械臂控制方法，其方法如下所述：步骤一、根据人脑认知系统各模块的工作原理和操作条件反射的机理，提供一种机械臂的认知学习模型机理；步骤二、提出一种基于小脑-基底神经节的行为认知模型和混合学习算法；步骤三、基于径向基函数网络的小脑-基底神经节操作条件学习算法设计，采用人工神经网络和强化学习方法建立一个能使机械臂自主学习的数学模型；步骤四、采用基于径向基函数网络的小脑-基底神经节操作条件认知学习模型，控制机械臂，在Matlab中，建立机械臂仿真实验模型...

【技术保护点】
1.一种基于RBF神经网络的机械臂控制方法，其特征在于：其方法如下所述：步骤一、根据人脑认知系统各模块的工作原理和操作条件反射的机理，提供一种机械臂的认知学习模型机理；步骤二、提出一种基于小脑‑基底神经节的行为认知模型和混合学习算法；步骤三、基于径向基函数网络的小脑‑基底神经节操作条件学习算法设计，采用人工神经网络和强化学习方法建立一个能使机械臂自主学习的数学模型；步骤四、采用基于径向基函数网络的小脑‑基底神经节操作条件认知学习模型，控制机械臂，在Matlab中，建立机械臂仿真实验模型；步骤五、在Matlab中，通过改变参数和变量进行可行性的测试，验证基于RBF神经网络的机械臂控制方法。

【技术特征摘要】
1.一种基于RBF神经网络的机械臂控制方法，其特征在于：其方法如下所述：步骤一、根据人脑认知系统各模块的工作原理和操作条件反射的机理，提供一种机械臂的认知学习模型机理；步骤二、提出一种基于小脑-基底神经节的行为认知模型和混合学习算法；步骤三、基于径向基函数网络的小脑-基底神经节操作条件学习算法设计，采用人工神经网络和强化学习方法建立一个能使机械臂自主学习的数学模型；步骤四、采用基于径向基函数网络的小脑-基底神经节操作条件认知学习模型，控制机械臂，在Matlab中，建立机械臂仿真实验模型；步骤五、在Matlab中，通过改变参数和变量进行可行性的测试，验证基于RBF神经网络的机械臂控制方法。2.根据权利要求1所述的一种基于RBF神经网络的机械臂控制方法，其特征在于：所述的步骤二中混合学习算法的核心是：探索行为ae，监督行为as，两者进行加权求和得到复合行为af，即：af←ωae+(1-ω)as(1)1)、概率式行为选择使用行为策略πA(s)，它是状态到行为的映射，用一个参数为θ的RBF网络进行逼近，类似热力学系统，智能体系统状态迁移的随机性表现出一定的统计规律，令它的探索行为选择服从概率分布，即Blotzmann-Gibbs分布：其中，T为热力学温度，KB为玻尔兹曼常数，为玻尔兹曼因子，Z为分配函数；将公式推演，探索行为ae替代状态s，ε(s)＝ε(ae)＝(ae-aA)2，T表示行为探索程度，即温度越高，探索程度越大，对于每一个确定的T，系统都有其对应的平衡点；2)、用评价值函数V(s)评价行为的正负效果，用RBF网络进行逼近，函数为：V(s)＝E{rt+1+γV(st+1)}(3)用奖惩信息rt+1和下一次迭代产生的评价值V(st+1)估计二次评价信号δ：δ＝rt+1+γV(st+1)-V(st)(4)其中，0＜γ＜1为评价奖惩因子；3)、模型中给监督器一个先验知识集，作为行为网络的期望映射，行为策略πA(s)中参数θ的更新由小脑模块和基底神经节模块共同实现，即：θ←θ+ωΔθBG+(1-ω)ΔθCB(5)用于权值调整的误差指标为：采用梯度下降法，网络权值的学习算法为：其中，η∈[0,1]为学习速率，δ为二次评价信号；4)、协调因子ω表示小脑的监督学习在行为网络的认知过程中占的比重，在学习控制过程的初始阶段，概率行为误差较大，行为网络采集到的状态信息较少且不准确，监督器的监督学习占有较大比重，但随着迭代次数的增多，后阶段小脑和基底神经节在其中的起的作用发生了变化，小脑模块的监督器在学习过程中的作用不断减少，强化机制起了主导，将协调因子用指数增加形式表示：3.根据权利要求1所述的一种基于RBF神经网络的机械臂控制方法，其特征在于：所述的步骤三中自主学习的数学模型利用RBF神经网络来实现，RBF神经网络具有三层结构：输入层、隐含层、输出层，具有相同的“感...

【专利技术属性】
技术研发人员：曲兴田，田农，王鑫，杜雨欣，张昆，李金来，刘博文，王学旭，
申请(专利权)人：吉林大学，
类型：发明
国别省市：吉林,22

全部详细技术资料下载我是这个专利的主人