The invention relates to an active learning method for robots based on image input. It includes the following steps: S1. In the simulation environment, build an environment similar to the real scene; S2. Make response maps and masks according to the acceptability of tasks; S3. Train the depth neural network by using the color images collected by R, the response maps and masks produced by R 2, use the encoder to extract the effective information from the pictures, and then use the decoder to generate the acceptability region. Response graph; S4. Deploy the trained depth neural network model to the real robot and try to accomplish the assigned task; S5. Save the color image and depth image captured by the camera in the current state and label them; S6. Use labeled data to fine-tune the network and repeat it; S7. The robot starts to perform tasks. By collecting a small amount of data in the simulation environment, a good depth neural network can be trained, and can be directly migrated to the real environment.
【技术实现步骤摘要】
一种基于图像输入的机器人主动学习方法
本专利技术属于人工智能
,更具体地,涉及一种基于图像输入的机器人主动学习方法。
技术介绍
近些年来,随着计算力的提高和深度学习算法的不断发展,数据驱动的方法在机器人领域中大放异彩。数据驱动的方法通常需要采集大量的数据,才能较好地训练深度神经网络模型,控制机器人完成相应的任务。不同于其他领域,使用真实机器人采集数据不仅代价高昂,耗时耗力,还会不可避免出现物理损耗,甚至可能产生危险。受限于实际条件,通常不可能使用真实的机器人在现实环境中采集大量的数据。因此急需找到一些方法来减少数据驱动方法所需的真实环境数据的数据量,或者用仿真环境数据代替真实环境数据来训练模型,最后再迁移到真实机器人上。机器人学习领域的研究方向主要分为监督学习和强化学习两个方向。监督学习通过采集大量的数据并进行标注,用来训练网络,按照标注数据的方法,又可以细分为自监督学习、模仿学习等方向;强化学习方法是通过机器人在环境中进行大量的随机探索来学会完成指定的任务。主动学习通过对未标注的数据进行筛选,可以利用少量的标注数据取得较高的学习准确度。主动学习通过某种选择策略从数据集中寻找未标注的数据让专家进行标注,被选中的数据是最具有学习价值的数据,用这样的标注样本进行学习,是最高效的学习。通过不断的选择数据、进行标注和训练网络,直至满足终止条件,能够以最少的标注样本得到效果优良的模型。A.Zengetal.RoboticPick-and-PlaceofNovelObjectsinClutterwithMulti-AffordanceGraspingandCro ...
【技术保护点】
1.一种基于图像输入的机器人主动学习方法,其特征在于,包括以下步骤:S1.在仿真环境中,搭建一个类似于现实场景的环境,捕获仿真环境中的彩色图像和对应的物体的位置,保存为数据集;S2.根据任务的可受性制作响应图和掩膜;S3.使用步骤S1采集的彩色图像、步骤S2制作的响应图和掩膜图,训练深度神经网络,使用编码器从图片中提取有效的信息,再使用解码器生成表示可受性区域响应图;S4.将训练好的深度神经网络模型部署到真实机器人上,尝试完成指定的任务;S5.保存当前状态下摄像头捕获的彩色图像和深度图像,进行标注;S6.使用标注数据对网络进行微调,重复步骤S4;S7.机器人开始执行任务。
【技术特征摘要】
1.一种基于图像输入的机器人主动学习方法,其特征在于,包括以下步骤:S1.在仿真环境中,搭建一个类似于现实场景的环境,捕获仿真环境中的彩色图像和对应的物体的位置,保存为数据集;S2.根据任务的可受性制作响应图和掩膜;S3.使用步骤S1采集的彩色图像、步骤S2制作的响应图和掩膜图,训练深度神经网络,使用编码器从图片中提取有效的信息,再使用解码器生成表示可受性区域响应图;S4.将训练好的深度神经网络模型部署到真实机器人上,尝试完成指定的任务;S5.保存当前状态下摄像头捕获的彩色图像和深度图像,进行标注;S6.使用标注数据对网络进行微调,重复步骤S4;S7.机器人开始执行任务。2.根据权利要求1所述的一种基于图像输入的机器人主动学习方法,其特征在于,所述的S1步骤具体包括:S11.在场景中放置一张桌子,桌子上摆放了机器人、摄像头和一些物体;S12.在仿真器中,随机设置桌子和地板的颜色,随机选择一个或多个物体摆放在桌子上,随机产生物体摆放的位置,随机改变物体的颜色和纹理,随机改变环境的光照强度;S13.记录摄像头捕获的彩色图像和对应的物体的位置,保存为数据集。3.根据权利要求2所述的一种基于图像输入的机器人主动学习方法,其特征在于,所述的S2步骤具体包括:S21.根据任务的特点,计算对于指定任务下物体的可受性区域,对于抓取任务,可受性区域为物体的几何中心点;对于推动任务,可受性区域为终点物体与起点物体的连线的延长线某一区域处;S22.根据可受性区域,制作响应图,在图上表示为一个服从高斯分布的高亮圆形,圆心的位置即为可受性区域的中心位置;S23.根据可受性区域,制作掩膜图,在图上表示为一个服从高斯分布的高亮圆形,圆心的位置即为可受性区域的中心位置,半径比响应图的圆形要大。4.根据权利要求3所述的一种基于图像输入的机器人主动学习方法,其特征在于,所述的S3步骤具体包括:S31.对输入到网络的图片进行归一化,归一化后图像像素值的范围是(-1,1);S32.网络使用Adam优化器进行梯度下降,学习率设定为10e-4,mini-batch设定为32,所有参数均随机初始化;S33.编码器由4个卷积层组成,在每个卷积层后均跟有池化层和批标准化层;每个卷积层都使用4*4的卷积核,步长为2,使用leaky_relu函数作为激活函数;解码器由4个反卷积层组成,在每个反卷积层后均跟有批标准化层;反卷积层使用4*4的卷积核,步长为2;最后一个反卷积层使用tanh作为激活函数,其余层均使用leaky_relu函数作为激活函数;S34.网...
【专利技术属性】
技术研发人员:成慧,吴华栋,杨凯,张东,
申请(专利权)人:中山大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。