基于发育网络的移动机器人运动方向预先决策方法技术

技术编号：21590824 阅读：24 留言：0更新日期：2019-07-13 14:05

本发明专利技术属于机器人智能控制技术领域，公开一种基于发育网络的移动机器人运动方向预先决策方法，包括以下步骤：1)发育网络的创建、训练和测试；2)在每次执行任务后的非工作状态下，由动作输出层激活次数最高的某个神经元触发发育网络中间层神经元的侧向激励机制，实现机器人运动方向的预先决策：计算Z层神经元的激活概率pi：

Pre-decision-making method of mobile robot motion direction based on developmental network

全部详细技术资料下载

【技术实现步骤摘要】
基于发育网络的移动机器人运动方向预先决策方法
本专利技术属于机器人智能控制
，具体涉及一种基于发育网络的移动机器人运动方向预先决策方法。
技术介绍
神经生物学研究表明，感知学习不是与感知皮层的神经活动变化相关联，而是与决策相关的高级区域的神经活动变化相关联。研究发现，在运动方向辨识任务中，行为的改进与侧顶叶内皮层(决策区域)的神经元可塑性相关，但与颞中回(感觉区域)的神经元可塑性无关。既然感知学习与与决策相关的高级区域内的神经元活动变化相关联，很自然就产生了将人脑的感知学习机理引入到机器人的行为决策中来的想法，模仿人脑感知环境过程中的迁移学习机理，使机器人在进行感知学习的过程中，在执行任务的间隙，仍可以进行思考。该过程类似于人类在无外界输入信号时，仍在进行思考，对未来的事情进行预演或彩排，这种预演会对人类后续的行为产生影响。同理，机器人在非任务状态下的思考，可以对后续的运动行为进行预先决策，同时将决策的结果写到数据库中，不断更新数据库，使机器人在下次执行任务时得到更好的决策指导。若能将迁移学习思想应用于机器人领域，使机器人在工作间隙也能进行思考，必将大大提高机器人行为学习的效率。但这些关于感知学习中状态迁移的思想，目前都只应用于模式识别领域，在机器人行为学习中未见使用。近年来，随着人工智能的发展和硬件水平的不断进步，智能机器人也有了很大的进步和更加广阔的应用，对于移动机器人自主行为学习的研究也越来越引起人们的重视。本专利技术在移动机器人领域引入自主发育网络，使机器人在环境感知过程的间隙，通过非工作状态下的“思考”，将机器人已经学习过的环境位置信息与对...

【技术保护点】
1.基于发育网络的移动机器人运动方向预先决策方法，其特征在于，包括以下步骤：1)发育网络的创建、训练和测试；发育网络分为三层：X层、Y层、Z层；X层作为网络输入层，其神经元个数与输入矩阵元素个数相同；Y层为中间层，设置了10000个神经元，用于存储知识；Z层作为动作输出层，每个神经元分别代表8个方向之一；2)在每次执行任务后的非工作状态下，由动作输出层激活次数最高的某个神经元触发发育网络中间层神经元的侧向激励机制，机器人将运动过程中遇到的新知识保存，最终实现机器人运动方向的预先决策：计算Z层神经元的激活概率pi：

【技术特征摘要】
1.基于发育网络的移动机器人运动方向预先决策方法，其特征在于，包括以下步骤：1)发育网络的创建、训练和测试；发育网络分为三层：X层、Y层、Z层；X层作为网络输入层，其神经元个数与输入矩阵元素个数相同；Y层为中间层，设置了10000个神经元，用于存储知识；Z层作为动作输出层，每个神经元分别代表8个方向之一；2)在每次执行任务后的非工作状态下，由动作输出层激活次数最高的某个神经元触发发育网络中间层神经元的侧向激励机制，机器人将运动过程中遇到的新知识保存，最终实现机器人运动方向的预先决策：计算Z层神经元的激活概率pi：其中，按照激活概率大小排序，激活前几个概率不为0的Z层神经元；激活每个概率不为0的Z层神经元时，依次执行如下过程：由Z层向Y层输入数据→激活Y层神经元→侧向激励→在新激活的神经元中保存新知识→建立保存有新知识的Y层神经元与Z层对应的神经元之间的权值连接。2.根据权利要求1所述的基于发育网络的移动机器人运动方向预先决策方法，其特征在于：发育网络中，X层到Y层以及Y层到Z层之间的权重更新公式为：其中，vj代表第j个神经元的权值向量，ω1(nj)+ω2(nj)≡1，ω2(nj)是学习率，ω1(nj)是保持率，p为输入矩阵，对于发放的神经元，yj＝1，否则yj＝0。3.根据权利要求1所述的基于发育网络的移动机器人运动方向预先决策方法，其特征在于：所述新知识是指新的环境位置信息，其确定依据为：发育网络训练好后，输入相应的输入信息，计算输入信息与机器人已经学过知识的匹配度，匹配度低于设定阈值的便认为是新知识，匹配度计算公式如下：其中，vb和vt分别代表自底向上和自上而下的权值向量，b和t分别代表自底向上和自上而下的输入向量。4.根据权利要求1所述的基于发育网络的移动机器人运动方向预先决策方法，其特征在于：步骤2)中，根据来自Z层的自顶向下的输入和其对应的权值，利用统一的区域函数，获得Y层神经元发放之前的能量值，根据Top-k竞争规则，激活前k个响应不为零的Y层神经元。5.根据权利要求1或4所述的基于发育网络的移动机器人运动方向预先决策方法，其特征在于：步骤2)中，假设前四个Z层神经元概率不为0，概率从大到小排序为：[neuronl，neuron3，neuron2，neuron5]，则进入四次循环，依次执行所述过程；第一次循环中，Z层到Y层的输入为[1，0，0，0，0，0，0，0]，然后计算Y层神经元的响应值，激活响应值不为零的神经元，然后将这些神经元按如下公式进行能量值缩放：其中，ri′代表第i个神经元缩放后的能量值，k代...

【专利技术属性】
技术研发人员：王东署，杨凯，罗勇，辛健斌，王河山，马天磊，
申请(专利权)人：郑州大学，
类型：发明
国别省市：河南,41

全部详细技术资料下载我是这个专利的主人