一种仿人脑记忆机理的机器人行为决策方法及设备技术

技术编号：30432242 阅读：11 留言：0更新日期：2021-10-24 17:26

本申请的目的是提供一种仿人脑记忆机理的机器人行为决策方法及设备，本申请通过获取目标任务和当前环境信息；计算当前环境信息与所有长期记忆环境信息的相似度值，确定最相似长期记忆环境信息；当前环境信息与所述最相似长期记忆环境信息的相似度值小于相似度阈值时，在短期记忆层存储当前环境信息，并进行离线学习直至转移至长期记忆层；基于目标任务和当前环境信息，通过神经网络模型输出行为决策并执行，即在机器人处于动态变化的环境中，在通常的在线学习外增加离线学习的能力，实现机器人未知环境中的增量式学习，提高了学习效率，可以快速收敛到稳定状态，从而提高机器人在新环境中的行为决策的效率和精确度。在新环境中的行为决策的效率和精确度。在新环境中的行为决策的效率和精确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种仿人脑记忆机理的机器人行为决策方法及设备

[0001]本申请涉及计算机领域，尤其涉及一种仿人脑记忆机理的机器人行为决策方法及设备。

技术介绍

[0002]现有技术中，在某种特定的环境中，经过训练的机器人可以在该环境中很好地执行任务，因为机器人对该环境中的信息有了较充分的认知。但是当机器人处于动态变化的环境中或在新的环境中执行任务时，由于对新环境认知的不完整性，机器人往往具有较低的决策效果，如扫地机器人、服务机器人、码垛机器人等，在新的环境下需要重新学习地图信息，导致机器人的行为决策效率低，对新环境的适应能力差。
[0003]因此，如何进行增量式学习，减少神经网络进行大量样本数据的训练，对遇到的特定环境中的环境信息进行针对性的学习，提高学习效率，在新环境下可以快速收敛到稳定状态，从而提高机器人在新环境中的行为决策效率和精度，是目前本领域人员研究的方向。

技术实现思路

[0004]本申请的一个目的是提供一种仿人脑记忆机理的机器人行为决策方法及设备，以解决现有技术中如何进行增量式学习，提高机器人在新环境中的行为决策效率和精度的问题。
[0005]根据本申请的一个方面，提供了一种仿人脑记忆机理的机器人行为决策方法，包括：获取目标任务和当前环境信息；计算所述当前环境信息与所有长期记忆环境信息的相似度值，确定最相似长期记忆环境信息；当所述当前环境信息与所述最相似长期记忆环境信息的相似度值小于相似度阈值时，在短期记忆层存储所述当前环境信息，并进行离线学习直至转移至长期记忆层；基于所述目标任务和所...

【技术保护点】

【技术特征摘要】
1.一种仿人脑记忆机理的机器人行为决策方法，其特征在于，所述方法包括：获取目标任务和当前环境信息；计算所述当前环境信息与所有长期记忆环境信息的相似度值，确定最相似长期记忆环境信息；当所述当前环境信息与所述最相似长期记忆环境信息的相似度值小于相似度阈值时，在短期记忆层存储所述当前环境信息，并进行离线学习直至转移至长期记忆层；基于所述目标任务和所述当前环境信息，通过神经网络模型输出行为决策并执行。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：当所述当前环境信息与所述最相似长期记忆环境信息的相似度值大于等于所述相似度阈值时，选取所述最相似长期记忆环境信息对应的动作决策作为所述行为决策并执行。3.根据权利要求1所述的方法，其特征在于，所述在短期记忆层存储所述当前环境信息，包括：计算所述当前环境信息与所有短期记忆环境信息的相似度，确定最相似短期记忆环境信息；当所述当前环境信息与所述最相似短期记忆环境信息的相似度值大于所述相似度阈值时，将所述最相似短期记忆环境信息对应的神经元的年龄加一；当所述当前环境信息与所述最相似短期记忆环境信息的相似度值小于等于所述相似度阈值时，通过评价函数确定所述当前环境信息在所述短期记忆层的位置并进行存储，得到新的短期记忆环境信息。4.根据权利要求3所述的方法，其特征在于，所述在短期记忆层存储所述当前环境信息，并进行离线学习直至转移至长期记忆层，包括：在离线状态时，基于记忆回放机制将动作神经元的激活状态信息通过反向传播激活所述长期记忆层中的部分神经元，得到在所述长期记忆层中的为从所述短期记忆层转移来的所述短期记忆环境信息提供的存储空间；基于记忆回放机制将所述动作神经元的激活概率，通过反向传播激活所述短期记忆层中的部分神经元，并将所述短期记忆环境信息转移至所述长期记忆层中的所述存储空间中；在所述长期记忆层中对从所述短期记忆层转移来的所述短期记忆环境信息进行学习，得到所述新的长期记忆环境信息。5.根据权利要求4所述的方法，其特征在于，所述在离线状态时，基于记忆回放机制将所述动作神经元的激活状态信息通过反向传播激活所述长期记忆层中的部分神经元，得到在所述长期记忆层中为从所述短期记忆层转移来的所述短期记忆环境信息提供存储空间之前，还包括：根据所述动作神经元在之前工作中被激...

【专利技术属性】
技术研发人员：王东署，罗勇，辛健斌，王河山，马天磊，张方方，
申请(专利权)人：郑州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人