具有模仿学习机制的仿生轮式机器人系统及方法技术方案

技术编号:10161896 阅读:260 留言:0更新日期:2014-07-01 17:25
本发明专利技术涉及具有模仿学习机制的仿生轮式机器人系统及方法。所述系统包括示教机器人A和模仿机器人B。机器人系统工作时,首先由示教机器人A演示示教行为,然后,模仿机器人B观测并模仿机器人A的示教行为。本发明专利技术将一种由舵机和红外线传感器组装而成的旋转装置搭载在模仿机器人上,通过旋转检测的行为捕捉方法,采集离散示教观测点的动作信息,然后将这些信息应用模仿学习算法,指导模仿机器人模仿学习示教行为。大大降低了传感器的成本,同时克服了传统运用摄像技术采集示教行为后图像处理的繁琐过程,提高了机器人模仿学习的效率,减少了机器人学习的时间。

【技术实现步骤摘要】
具有模仿学习机制的仿生轮式机器人系统及方法
本专利技术属于智能机器人领域,涉及一种具有模仿学习机制的仿生轮式机器人系统及方法。
技术介绍
人或动物的诸多技能或行为是在其神经系统认知过程中渐进地形成和发展起来的,理解和模拟人或动物神经系统内在的认知机制,并将这种机制赋予机器或人工生命系统,是认知科学,以及人工智能和机器人学研究的重要课题。设计制造具有自主性、智能性和适应性的机器人系统,并将人和动物的认知能力赋予机器人等人工系统,使其更好地服务于人类,是仿生机器人的研究热点之一。许多生物具有趋声的行为(如蟋蟀),趋热的行为(如田鼠),或趋光的行为(如金龟子)。生物的趋热趋光等行为虽然简单,然而这种低级的行为直接地与运动神经系统和运动神经认知相关,是运动神经认知发育的结果。具有趋热趋光等行为的生物为运动神经机器人提供了很好的原型。自然界中,模仿是动物掌握运动技能最直接、最有效的学习方式。同时,模仿学习也是人类学习的一种重要手段和方式。而人类与动物是机器人的仿生原型,因此将模仿的机制应用于机器人是可行的。模仿学习使机器人通过观察示教者的行为来快速学习,具体来说是通过观测、学习、理解、再现智能的行为从而实现机器人的仿生特性,它包括机构模仿、动作模仿、机理控制模仿和认知模仿。这种在与环境的交流中学习新知识和解决问题的方法,使得模仿学习与传统的孤立的机器人学习方法相比,具有很多优势:(1)提高个体的适应性;(2)提高自主性;(3)减少学习次数和学习时间,提高学习效率;(4)简化学习过程;(5)提高人机交互能力;(6)减少程序编制复杂度。具有模仿学习能力的机器人更适合成为人类的助手和伙伴,无论操作者是否了解机器人的工作原理以及对机器人编程所使用的语言,它都能同人类协调地完成工作任务。因此,模仿学习无论在军事领域还是民事领域都具有广泛的应用前景。模仿学习不仅是行为科学和神经科学的研究重点,对于人工智能和机器学习而言也具有非常重要的研究意义。目前,将模仿学习机制运用到智能机器人实体的实验并不多,且动作模仿居多。其中示教行为的观测采集大多数运用摄像技术,例如日本研究人员HirokiUchida将模仿学习机制运用到二连杆机器人上,通过摄像头采集示教动作来实现仿爬虫爬行动作的模仿,在模仿学习运用到实际机器人上取得一些突破。但这种机器人所用设备成本高,且摄像头采集图像后必须通用图像处理技术进一步处理数据,实时操作性差,模仿效果完成所耗时间长。
技术实现思路
针对现有技术中存在的动作模仿学习居多、使用摄像头采集图像后数据处理过程繁琐使机器人学习效率低等问题,本专利技术提出一种具有模仿学习机制的仿生轮式机器人系统及方法,通过机器人A示教,机器人B观测并模仿学习示教行为,大大降低了传感器成本,克服了采用摄像技术采集示教行为带来的图像处理繁琐的问题,提高了机器人模仿学习的效率。本专利技术提出机器人,是一种仿生物体运动神经的认知机器人,主要包括机器人机械本体和控制系统。机器人机械本体采用轮式结构;机器人控制系统仿照生物体的大脑与小脑,完成信号数据处理、电机和舵机控制以及实现模仿学习算法等功能。本专利技术采取以下技术方案:具有模仿学习机制的仿生轮式机器人系统,包括示教机器人A和模仿机器人B。示教机器人A用作示教者,向模仿机器人B演示示教行为;模仿机器人B为被训练学习对象,通过观测和模仿学习独立完成机器人A的示教行为。其特征在于:示教机器人A包括:机器人主体骨架101,固定在主体骨架两侧的驱动轮,即左轮102和右轮103,固定在主体骨架前侧的随动轮104,在机器人主体骨架上的STM32控制器105,固定在主体骨架上的左、右360度连续旋转的直流电机106、107,固定在机器人主体骨架前端的超声波传感器108,固定在主体骨架左前侧、左后侧、右前侧、右后侧的四个光敏传感器109、110、111、112,固定在主体骨架左前侧、左后侧、右前侧、右后侧的四个温度传感器113、114、115、116,固定在主体骨架下方两个电机之间的霍尔传感器117。四个光敏传感器109、110、111、112采集环境的亮度值,四个温度传感器113、114、115、116采集环境的温度值,超声波传感器108检测前方障碍物的距离,霍尔传感器117检测两个电机的转速。四个光敏传感器109、110、111、112、四个温度传感器113、114、115、116和超声波传感器108以及霍尔传感器117的输出端分别与STM32控制器105的输入端相连,STM32控制器105的输出端与直流电机106、107相连。模仿机器人B包括:机器人主体骨架201,固定在主体骨架两侧的驱动轮,即左轮202和右轮203,固定在主体骨架前侧的随动轮204,在机器人主体骨架上的STM32控制器205,固定在主体骨架上的左、右360度连续旋转的直流电机206、207,还包括固定在机器人主体骨架前段的360度连续旋转伺服舵机208,搭载在舵机上的红外线传感器209,固定在机器人主体骨架前端的超声波传感器210,固定在主体骨架左前侧、左后侧、右前侧、右后侧的四个光敏传感器211、212、213、214,固定在主体骨架左前侧、左后侧、右前侧、右后侧的四个温度传感器215、216、217、218,固定在主体骨架下方两个电机之间的霍尔传感器219。红外线传感器209检测前方光源的距离,四个光敏传感器211、212、213、214采集环境的亮度值,四个温度传感器215、216、217、218采集环境的温度值,超声波传感器210检测前方障碍物的距离,霍尔传感器219检测两个电机206、207的转速。红外线传感器209、四个光敏传感器211、212、213、214、四个温度传感器215、216、217、218和超声波传感器210以及霍尔传感器219的输出端分别与STM32控制器205的输入端相连,STM32控制器205的输出端与转直流电机206、207以及伺服舵机208相连。本专利技术所述机器人系统工作时,首先由示教机器人A演示示教行为,然后,模仿机器人B观测模仿机器人A的示教行为。(1)示教机器人A演示示教行为当机器人启动后,超声波传感器检测到光源热源的距离信号将发生改变,四个光敏传感器检测到各自方向的环境亮度信号,四个温度传感器检测到各自方向的环境温度信号,霍尔传感器检测左右两轮的转速。超声波测距传感器、四个光敏传感器、四个温度传感器以及霍尔传感器将信号通过IO口传给STM32控制器,STM32控制器将采集到的信号进行处理后,得出机器人所处的环境信息,进而通过控制算法处理输出控制电机转动的PWM波,驱动直流电机转动,并带动左、右轮运动,使机器人完成相应的动作。(2)模仿机器人B观测示教行为示教机器人A开始运动后,模仿机器人B进入观测阶段。机器人B通过旋转检测装置,运用旋转测距方法统计出示教机器人A与光源热源的距离变化的数据组S3。为了保证模仿学习效果的质量,示教机器人A的示教行为至少执行30次,即模仿机器人B的观测阶段需要观测示教行为至少30次以上,才可进入下一操作阶段。示教结束后,控制器分析30次示教观测获得的数据组S3的数据变化特征,经模仿学习算法总结归纳出示教行为,通过示教行为的控制量变化分析,向模仿机器人B下达相关指令。本文档来自技高网
...
具有模仿学习机制的仿生轮式机器人系统及方法

【技术保护点】
具有模仿学习机制的仿生轮式机器人系统,包括示教机器人A和模仿机器人B;示教机器人A用作示教者,向模仿机器人B演示示教行为;模仿机器人B为被训练学习对象,通过观测和模仿学习独立完成机器人A的示教行为;其特征在于:示教机器人A包括:机器人主体骨架(101),固定在主体骨架两侧的驱动轮,即左轮(102)和右轮(103),固定在主体骨架前侧的随动轮(104),在机器人主体骨架上的STM32控制器(105),固定在主体骨架上的左、右360度连续旋转的直流电机(106)、(107),固定在机器人主体骨架前端的超声波传感器(108),固定在主体骨架左前侧、左后侧、右前侧、右后侧的四个光敏传感器(109)、(110)、(111)、(112),固定在主体骨架左前侧、左后侧、右前侧、右后侧的四个温度传感器(113)、(114)、(115)、(116),固定在主体骨架下方两个电机之间的霍尔传感器(117);四个光敏传感器(109)、(110)、(111)、(112)采集环境的亮度值,四个温度传感器(113)、(114)、(115)、(116)采集环境的温度值,超声波传感器(108)检测前方障碍物的距离,霍尔传感器(117)检测两个电机的转速;四个光敏传感器(109)、(110)、(111)、(112)、四个温度传感器(113)、(114)、(115)、(116)和超声波传感器(108)以及霍尔传感器(117)的输出端分别与STM32控制器(105)的输入端相连,STM32控制器(105)的输出端与直流电机(106)、(107)相连;模仿机器人B包括:机器人主体骨架(201),固定在主体骨架两侧的驱动轮,即左轮(202)和右轮(203),固定在主体骨架前侧的随动轮(204),在机器人主体骨架上的STM32控制器(205),固定在主体骨架上的左、右360度连续旋转的直流电机(206)、(207),还包括固定在机器人主体骨架前段的360度连续旋转伺服舵机(208),搭载在舵机上的红外线传感器(209),固定在机器人主体骨架前端的超声波传感器(210),固定在主体骨架左前侧、左后侧、右前侧、右后侧的四个光敏传感器(211)、(212)、(213)、(214),固定在主体骨架左前侧、左后侧、右前侧、右后侧的四个温度传感器(215)、(216)、(217)、(218),固定在主体骨架下方两个电机之间的霍尔传感器(219);红外线传感器(209)检测前方光源的距离,四个光敏传感器(211)、(212)、(213)、(214)采集环境的亮度值,四个温度传感器(215)、(216)、(217)、(218)采集环境的温度值,超声波传感器(210)检测前方障碍物的距离,霍尔传感器(219)检测两个电机(206)、(207)的转速;红外线传感器(209)、四个光敏传感器(211)、(212)、(213)、(214)、四个温度传感器(215)、(216)、(217)、(218)和超声波传感器(210)以及霍尔传感器(219)的输出端分别与STM32控制器(205)的输入端相连,STM32控制器(205)的输出端与转直流电机(206)、(207)以及伺服舵机(208)相连。...

【技术特征摘要】
1.具有模仿学习机制的仿生轮式机器人系统模仿学习的方法,应用如下具有模仿学习机制的仿生轮式机器人系统,该系统包括示教机器人A和模仿机器人B;示教机器人A用作示教者,向模仿机器人B演示示教行为;模仿机器人B为被训练学习对象,通过观测和模仿学习独立完成机器人A的示教行为;示教机器人A包括:机器人主体骨架(101),固定在主体骨架两侧的驱动轮,即左轮(102)和右轮(103),固定在主体骨架前侧的随动轮(104),在机器人主体骨架上的STM32控制器(105),固定在主体骨架上的左、右360度连续旋转的直流电机(106)、(107),固定在机器人主体骨架前端的超声波传感器(108),固定在主体骨架左前侧、左后侧、右前侧、右后侧的四个光敏传感器(109)、(110)、(111)、(112),固定在主体骨架左前侧、左后侧、右前侧、右后侧的四个温度传感器(113)、(114)、(115)、(116),固定在主体骨架下方两个电机之间的霍尔传感器(117);四个光敏传感器(109)、(110)、(111)、(112)采集环境的亮度值,四个温度传感器(113)、(114)、(115)、(116)采集环境的温度值,超声波传感器(108)检测前方障碍物的距离,霍尔传感器(117)检测两个电机的转速;四个光敏传感器(109)、(110)、(111)、(112)、四个温度传感器(113)、(114)、(115)、(116)和超声波传感器(108)以及霍尔传感器(117)的输出端分别与STM32控制器(105)的输入端相连,STM32控制器(105)的输出端与直流电机(106)、(107)相连;模仿机器人B包括:机器人主体骨架(201),固定在主体骨架两侧的驱动轮,即左轮(202)和右轮(203),固定在主体骨架前侧的随动轮(204),在机器人主体骨架上的STM32控制器(205),固定在主体骨架上的左、右360度连续旋转的直流电机(206)、(207),还包括固定在机器人主体骨架前段的360度连续旋转伺服舵机(208),搭载在舵机上的红外线传感器(209),固定在机器人主体骨架前端的超声波传感器(210),固定在主体骨架左前侧、左后侧、右前侧、右后侧的四个光敏传感器(211)、(212)、(213)、(214),固定在主体骨架左前侧、左后侧、右前侧、右后侧的四个温度传感器(215)、(216)、(217)、(218),固定在主体骨架下方两个电机之间的霍尔传感器(219);红外线传感器(209)检测前方光源的距离,四个光敏传感器(211)、(212)、(213)、(214)采集环境的亮度值,四个温度传感器(215)、(216)、(217)、(218)采集环境的温度值,超声波传感器(210)检测前方障碍物的距离,霍尔传感器(219)检测两个电机(206)、(207)的转速;红外线传感器(209)、四个光敏传感器(211)、(212)、(213)、(214)、四个温度传感器(215)、(216)、(217)、(218)和超声波传感器(210)以及霍尔传感器(219)的输出端分别与STM32控制器(205)的输入端相连,STM32控制器(205)的输出端与转直流电机(206)、(207)以及伺服舵机(208)相连;其特征在于,包括以下步骤:步骤1,示教机器人A执行示教行为;通过计算机串口向示教机器人A的STM32控制器(105)传送示教指令,机器人A运用它的多种传感器工作以及电机驱动,完成相应命令的动作行为,并在命令中设定示教行为终止信号;具体包括以下步骤:步骤1.1,初始化示教机器人A;配置STM32控制器(105)寄存器状态,初始化全局和局部变量,初始化传感器和左右直流电机的控制量;步骤1.2,选择机器人的示教任务,并读取预存于机器人内部的示教指令,四个光敏传感器(109)、(110)、(111)、(112)采集各自方向的环境亮度信号,四个温度传感器(113)、(114)、(115)、(116)采集各自方向的环境温度信号,霍尔传感器(117)采集左右直流电机(106)、(107)的转速;步骤1.3,STM32控制器(105)将传感器采集的亮度和温度数据运用均值算法进行处理,并将亮度和温度进行融合得到环境的亮温度值M;步骤1.4,采用模糊控制算法对步骤1.3得到的数据进行处理,输出PWM波至左、右两个直流电机(106)、(107),完成相应动作,直至满足示教结束条件;步骤2,模仿机器人B观测示教机器人A的示教行为;在示教机器人A开始工作的同时,模仿机器人B控制系统的行为捕捉装置开始工作,具体包括以下步骤:步骤2.1,初始化模仿机器人B;配置STM32控制器(105)寄存器状态,初始化全局和局部变量,初始化传感器和左右直流电机的控制量;步骤2.2,模仿机器人B进行行为捕捉;步骤2.3,将导出的30次示教行为采集的数据组S3,应用示教行为理解算法进行数据处理,得到模仿函数I(s,a)、示教函数T(s,a)和模仿机器人B到光源的距离函数R(s,a),其中s代表机器人状态,a代表机器人动作;步骤3,模仿机器人B模仿示教机器人A的示教行为;步骤3.1,初始化I(s,a)、...

【专利技术属性】
技术研发人员:于建均刘涛阮晓钢门玉森韩春晓徐骢驰于博
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1