当前位置: 首页 > 专利查询>郑州大学专利>正文

基于发育网络的移动机器人运动方向预先决策方法技术

技术编号:21590824 阅读:24 留言:0更新日期:2019-07-13 14:05
本发明专利技术属于机器人智能控制技术领域,公开一种基于发育网络的移动机器人运动方向预先决策方法,包括以下步骤:1)发育网络的创建、训练和测试;2)在每次执行任务后的非工作状态下,由动作输出层激活次数最高的某个神经元触发发育网络中间层神经元的侧向激励机制,实现机器人运动方向的预先决策:计算Z层神经元的激活概率pi:

Pre-decision-making method of mobile robot motion direction based on developmental network

【技术实现步骤摘要】
基于发育网络的移动机器人运动方向预先决策方法
本专利技术属于机器人智能控制
,具体涉及一种基于发育网络的移动机器人运动方向预先决策方法。
技术介绍
神经生物学研究表明,感知学习不是与感知皮层的神经活动变化相关联,而是与决策相关的高级区域的神经活动变化相关联。研究发现,在运动方向辨识任务中,行为的改进与侧顶叶内皮层(决策区域)的神经元可塑性相关,但与颞中回(感觉区域)的神经元可塑性无关。既然感知学习与与决策相关的高级区域内的神经元活动变化相关联,很自然就产生了将人脑的感知学习机理引入到机器人的行为决策中来的想法,模仿人脑感知环境过程中的迁移学习机理,使机器人在进行感知学习的过程中,在执行任务的间隙,仍可以进行思考。该过程类似于人类在无外界输入信号时,仍在进行思考,对未来的事情进行预演或彩排,这种预演会对人类后续的行为产生影响。同理,机器人在非任务状态下的思考,可以对后续的运动行为进行预先决策,同时将决策的结果写到数据库中,不断更新数据库,使机器人在下次执行任务时得到更好的决策指导。若能将迁移学习思想应用于机器人领域,使机器人在工作间隙也能进行思考,必将大大提高机器人行为学习的效率。但这些关于感知学习中状态迁移的思想,目前都只应用于模式识别领域,在机器人行为学习中未见使用。近年来,随着人工智能的发展和硬件水平的不断进步,智能机器人也有了很大的进步和更加广阔的应用,对于移动机器人自主行为学习的研究也越来越引起人们的重视。本专利技术在移动机器人领域引入自主发育网络,使机器人在环境感知过程的间隙,通过非工作状态下的“思考”,将机器人已经学习过的环境位置信息与对应的运动方向预先建立联系,使机器人在后续的环境认知过程中,遇到类似的环境信息时,通过迁移学习,迅速确定运动方向,实现对运动行为的自主决策,不断提高机器人的智能。现有的机器人运动方向预测方法,大多是采用模型预测方法,通过对运动过程进行建模来预测其运动角度、位置或者姿态。但基于模型预测控制的机器人运动控制方法需要辨识模型,分析干扰,确定性能指标,整个问题集合了众多信息,在线计算量较大,难以实时控制,且开环控制+滚动优化的实施需要闭环特性的分析,甚至是标称稳定性的分析,一定程度上限制了该方法的使用。
技术实现思路
针对上述情况,本专利技术的目的是提供一种基于发育网络的移动机器人运动方向预先决策方法,在机器人工作的间隙,即非工作状态下,通过发育网络中间层神经元的侧向激励机制,在发放的神经元周围激活(或招募)更多的神经元来存储类似的环境位置信息,并将这些位置信息与机器人最佳的运动方向预先建立联系,当机器人在后续环境认知过程中,遇到类似的环境位置信息时,机器人就可以从已经学习的知识中,迅速确定运动方向,提高行为决策的效率。本专利技术提供了一种基于发育网络的移动机器人运动方向预先决策方法,包括以下步骤:1)发育网络的创建、训练和测试;发育网络分为三层:X层、Y层、Z层;X层作为网络输入层,其神经元个数与输入矩阵元素个数相同;Y层为中间层,设置了10000个神经元,用于存储知识;Z层作为动作输出层,每个神经元分别代表8个方向之一;2)在每次执行任务后的非工作状态下,由动作输出层激活次数最高的某个神经元触发发育网络中间层神经元的侧向激励机制,机器人将运动过程中遇到的新知识保存,最终实现机器人运动方向的预先决策:计算Z层神经元的激活概率pi:其中,按照激活概率大小排序,激活前k个(一般取k=1)概率不为0的Z层神经元;激活每个概率不为0的Z层神经元时,依次执行如下过程:由Z层向Y层输入数据→激活Y层神经元→侧向激励→在新激活的神经元中保存新知识→建立保存有新知识的Y层神经元与Z层对应的神经元之间的权值连接。本专利技术主要以发育网络为基础,结合机器人非工作状态下的“思考”和发育网络中间层神经元的侧向激励机制,通过迁移学习,实现机器人环境认知中运动方向的预先决策。其中的发育网络创建、训练等可参照现有技术中的常规方式进行,该发育网络是采用美国密歇根州立大学翁巨杨教授模拟人类大脑的发育规律而提出的一种智能网络,属于本领域的公知常识。另外,本专利技术中的Z区、Y区分别是指Z层区域、Y层区域。根据本专利技术,发育网络中,X层到Y层以及Y层到Z层之间的权重更新公式为:其中,vj代表第j个神经元的权值向量,ω1(nj)+ω2(nj)≡1,ω2(nj)是学习率,ω1(nj)是保持率,p为输入矩阵,对于发放的神经元,yj=1,否则yj=0。本专利技术中,Z层作为动作输出层,每个神经元分别代表8个方向之一,也可以扩展为更多的运动方向。本专利技术中,所述新知识是指新的环境位置信息。新知识的确定依据为:发育网络训练好后,输入相应的输入信息,计算输入信息与机器人已经学过知识的匹配度,匹配度低于设定阈值的便认为是新知识,匹配度计算公式如下:其中,vb和vt分别代表自底向上和自上而下的权值向量,b和t分别代表自底向上和自上而下的输入向量。根据本专利技术,步骤2)中,将这些被激活的Z层神经元与所有Y层神经元建立权值连接,根据来自Z层的自顶向下的输入和其对应的权值,利用统一的区域函数,获得Y层神经元发放之前的能量值,根据Top-k竞争规则,激活前k个响应不为零的Y层神经元。进一步地,步骤2)中,假设前四个Z层神经元概率不为0,概率从大到小排序为:[neuron1,neuron3,neuron2,neuron5],则进入四次循环,依次执行所述过程;第一次循环中,Z层到Y层的输入为[1,0,0,0,0,0,0,0],然后计算Y层神经元的响应值,激活响应值不为零的神经元(这些被激活的Y层神经元均是属于第一类,即方向“1”所对应的神经元,其只与Z层第一个神经元有连接),然后将这些神经元按如下公式进行能量值缩放:其中,ri′代表第i个神经元缩放后的能量值,k代表激活的神经元总数,ri代表第i个神经元的能量值;这些被激活的Y层神经元发生侧向激励,激活更多的神经元用于记忆新知识;将机器人遇到的新知识进行分类整理,发育网络根据需要在与方向类别“1”对应的中间层神经元附近侧向激励出新的神经元,用于保存对应于方向类别“1”的新知识,侧向激励出的神经元能量值计算公式为:其中,r′ij表示第i个神经元激活的第j个神经元的能量值,d表示新激活的神经元j与激活它的神经元i之间的距离,ri代表第i个神经元的能量值;依次将对应于方向类别“1”的新知识(新的环境位置信息)按照神经元能量值大小存入特定神经元中,这样机器人便学习到了对应于方向类别“1”中的新知识,依次执行以上过程将对应于其它方向的新知识也进行记忆保存。机器人在每次运行完之后,就可以将学习到的新知识与对应的运动方向建立连接,在后续的运动过程中,若遇到类似的环境位置信息,机器人就可以迅速确定运动方向,提高行为决策的效率。存储新知识时,根据机器人获得的新环境位置信息与这些被激活的神经元中已经存储的知识的匹配程度,确定这些新知识应该储存到哪一个被激活神经元周围的神经元中去,确定目标神经元之后,机器人将前一次环境探索过程中遇到的未训练过的新位置数据保存到这个目标神经元周围新激活的神经元中,并确定最佳运动方向(即与Z层中某个神经元建立联系),然后在这些新激活的且保存了新知识的Y层神经元与Z层对应的神经元(代表不同的运本文档来自技高网
...

【技术保护点】
1.基于发育网络的移动机器人运动方向预先决策方法,其特征在于,包括以下步骤:1)发育网络的创建、训练和测试;发育网络分为三层:X层、Y层、Z层;X层作为网络输入层,其神经元个数与输入矩阵元素个数相同;Y层为中间层,设置了10000个神经元,用于存储知识;Z层作为动作输出层,每个神经元分别代表8个方向之一;2)在每次执行任务后的非工作状态下,由动作输出层激活次数最高的某个神经元触发发育网络中间层神经元的侧向激励机制,机器人将运动过程中遇到的新知识保存,最终实现机器人运动方向的预先决策:计算Z层神经元的激活概率pi:

【技术特征摘要】
1.基于发育网络的移动机器人运动方向预先决策方法,其特征在于,包括以下步骤:1)发育网络的创建、训练和测试;发育网络分为三层:X层、Y层、Z层;X层作为网络输入层,其神经元个数与输入矩阵元素个数相同;Y层为中间层,设置了10000个神经元,用于存储知识;Z层作为动作输出层,每个神经元分别代表8个方向之一;2)在每次执行任务后的非工作状态下,由动作输出层激活次数最高的某个神经元触发发育网络中间层神经元的侧向激励机制,机器人将运动过程中遇到的新知识保存,最终实现机器人运动方向的预先决策:计算Z层神经元的激活概率pi:其中,按照激活概率大小排序,激活前几个概率不为0的Z层神经元;激活每个概率不为0的Z层神经元时,依次执行如下过程:由Z层向Y层输入数据→激活Y层神经元→侧向激励→在新激活的神经元中保存新知识→建立保存有新知识的Y层神经元与Z层对应的神经元之间的权值连接。2.根据权利要求1所述的基于发育网络的移动机器人运动方向预先决策方法,其特征在于:发育网络中,X层到Y层以及Y层到Z层之间的权重更新公式为:其中,vj代表第j个神经元的权值向量,ω1(nj)+ω2(nj)≡1,ω2(nj)是学习率,ω1(nj)是保持率,p为输入矩阵,对于发放的神经元,yj=1,否则yj=0。3.根据权利要求1所述的基于发育网络的移动机器人运动方向预先决策方法,其特征在于:所述新知识是指新的环境位置信息,其确定依据为:发育网络训练好后,输入相应的输入信息,计算输入信息与机器人已经学过知识的匹配度,匹配度低于设定阈值的便认为是新知识,匹配度计算公式如下:其中,vb和vt分别代表自底向上和自上而下的权值向量,b和t分别代表自底向上和自上而下的输入向量。4.根据权利要求1所述的基于发育网络的移动机器人运动方向预先决策方法,其特征在于:步骤2)中,根据来自Z层的自顶向下的输入和其对应的权值,利用统一的区域函数,获得Y层神经元发放之前的能量值,根据Top-k竞争规则,激活前k个响应不为零的Y层神经元。5.根据权利要求1或4所述的基于发育网络的移动机器人运动方向预先决策方法,其特征在于:步骤2)中,假设前四个Z层神经元概率不为0,概率从大到小排序为:[neuronl,neuron3,neuron2,neuron5],则进入四次循环,依次执行所述过程;第一次循环中,Z层到Y层的输入为[1,0,0,0,0,0,0,0],然后计算Y层神经元的响应值,激活响应值不为零的神经元,然后将这些神经元按如下公式进行能量值缩放:其中,ri′代表第i个神经元缩放后的能量值,k代...

【专利技术属性】
技术研发人员:王东署杨凯罗勇辛健斌王河山马天磊
申请(专利权)人:郑州大学
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1