一种基于深度强化学习的黄桃挖核机器人行为控制方法技术

技术编号：17780395 阅读：56 留言：0更新日期：2018-04-22 09:15

本发明专利技术属于计算机应用及人工智能技术领域，涉及一种基于深度强化学习的黄桃挖核机器人行为控制策略。针对传统的机械控制方法难以有效的对黄桃挖核机器人进行行为控制问题，本发明专利技术提出了一种基于深度强化学习的方法对具有视觉功能的黄桃挖核机器人进行行为控制，以期提高其工作性能。本发明专利技术发挥了深度学习的感知能力和强化学习的决策能力，使机器人能够利用深度学习识别桃核状态，进而，通过强化学习的方法指导单片机控制电机挖除桃核，以最终完成挖核任务。本发明专利技术对于利用机器代替人工劳力的挖核任务具有优势。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度强化学习的黄桃挖核机器人行为控制方法
本专利技术属于计算机应用及人工智能
，涉及一种基于深度强化学习的黄桃挖核机器人行为控制方法。
技术介绍
随着社会的发展和技术的进步，劳动力短缺以及劳动力价格的不断攀升等社会问题的出现，极大的促进了工业机器人的研究、应用与普及。近年来，工业机器人的研究和应用一直是科学研究和社会关注的热点之一。但由于工业机器人要求较高的灵巧性、较高的稳定性、较高的环境容忍度等技术因素，一直困扰着工业机器人的研发和应用。早期的工业机器人是机电一体化的产物，而随着市场对工业机器人性能的要求不断提高，使得计算机技术、图像识别技术等更高层次的技术不断的融入到工业机器人中，从而提高工业机器人的性能。具有视觉功能的工业机器人可以完成普通工业机器人难以完成的复杂工作，对于代替劳动力极具优势。目前带有视觉功能的工业机器人还不是非常普遍，工业机器人一般是通过开环的机械臂、机械手等一系列机械结构，模拟人的动作，来代替劳动力工作，实现社会生产。工业机器人的工作过程一般是采集信息、处理信息、执行动作、反馈信息等步骤。其中，采集信息、反馈信息主要依靠传感器，在特殊的环境下，视觉传感器便显得格外重要。甚至某些工作离开了摄像头就没法实现。我国的工业机器人研发主要是由中科院沈阳自动化研究所、哈尔滨工业大学、清华大学、上海交通大学等机构和高校为主，并成立了相关的工业机器人研究基地，已经取得了令人瞩目的成绩。如哈工大研究所研发的码垛机器人，已经取得了非常好的效果，并已投产使用。哈工大机器人集团还研制了其他领域的工业机器人，都取得了非常好的成绩。沈阳新松自动...
一种基于深度强化学习的黄桃挖核机器人行为控制方法

【技术保护点】
一种基于深度强化学习的黄桃挖核机器人行为控制方法，步骤如下：(1)特征提取首先利用深度学习方法进行特征提取，建立训练集和测试集；其中，使用10000张黄桃剖面图片作为训练集，分为360个类别，每个类别相差1°转角，测试集中包含500张桃核图片；训练集和测试集的图片均具有标签的；使用具有5层的卷积神经网络对训练集的核桃状态进行特征提取；(2)构建桃核图像的分类器采用softmax分类器对黄桃剖面图片进行分类，由于黄桃剖面图片分为360个类，因为分类的输出为360维的向量；首先确定分类器基本的决策规则，然后确定用来划分类别的阈值；用已知的黄桃剖面图片来训练分类器，已知的训练集是由已经被标记过的对象组成，提取这些对象的特征，然后利用分类器的决策面把特征向量划分成不同的区域，最终获得输入桃核图像的类别；具体地，把标准的人工挖核的桃核核尖的指向作为标准值，把摄像机实际获取的图像的桃核核尖指向偏离标准值的角度每一度分为1个类，有360个类，即类别数k＝360；softmax分类器函数hθ(x)形式如公式(1)所示：

【技术特征摘要】
1.一种基于深度强化学习的黄桃挖核机器人行为控制方法，步骤如下：(1)特征提取首先利用深度学习方法进行特征提取，建立训练集和测试集；其中，使用10000张黄桃剖面图片作为训练集，分为360个类别，每个类别相差1°转角，测试集中包含500张桃核图片；训练集和测试集的图片均具有标签的；使用具有5层的卷积神经网络对训练集的核桃状态进行特征提取；(2)构建桃核图像的分类器采用softmax分类器对黄桃剖面图片进行分类，由于黄桃剖面图片分为360个类，因为分类的输出为360维的向量；首先确定分类器基本的决策规则，然后确定用来划分类别的阈值；用已知的黄桃剖面图片来训练分类器，已知的训练集是由已经被标记过的对象组成，提取这些对象的特征，然后利用分类器的决策面把特征向量划分成不同的区域，最终获得输入桃核图像的类别；具体地，把标准的人工挖核的桃核核尖的指向作为标准值，把摄像机实际获取的图像的桃核核尖指向偏离标准值的角度每一度分为1个类，有360个类，即类别数k＝360；softmax分类器函数hθ(x)形式如公式(1)所示：其中，θ1,θ2,…,θk是模型的参数，x(i)是第i个输入样本，y(i)是第i个输入样本对应的类别，这一项是对概率分布进行归一化，使得所有的概率之和为1；(3)建立强化学习的动作集搭建的黄桃挖核机器人为6轴机器人，由6个伺服电机协同工作，完成黄桃的挖核工作，6个伺服电机的布置位置分别为：旋转底盘布置1个伺服电机、摩擦轮机构布置2个伺服电机、刀具机构布置2个伺服电机、下料机构布置1个伺服电机；将伺服电机旋转一周视为360个动作，即每一整数角度都为一...

【专利技术属性】
技术研发人员：葛宏伟，林娇娇，孙亮，赵明德，
申请(专利权)人：大连理工大学，
类型：发明
国别省市：辽宁,21

全部详细技术资料下载我是这个专利的主人