【技术实现步骤摘要】
一种面向机器人抓取的数据主动式选择方法
本专利技术属于计算机视觉
,尤其涉及基于深度学习、利用主动式学习减少数据标注成本的方法。
技术介绍
机器人抓取方式检测是一个具有重要应用意义的计算机视觉研究课题,它旨在给定一个场景的情况下,分析其中所包含物体的抓取方式,并选择最佳的抓取方式进行抓取。随着深度卷积神经网络(DeepConvolutionalNeuralNetworks,DCNNs)在计算机视觉领域的显著发展,其优秀的学习能力也被大量应用于机器人抓取方式检测研究。然而,相较于一般计算机视觉问题,例如目标检测、语义分割等,机器人抓取方式检测具有两个不可或缺的要求。一是该任务对于实时性的要求,若无法达到实时检测的效果,则该方法也毫无应用价值。二是该任务在陌生环境中所需的学习成本,不同环境中的物体多种多样,若要一个方法更好地应用于一个陌生环境中,那么需要重新获取数据、标注数据并训练以获得更令人满意的检测结果。当前的深度学习方法需要大量已标注的数据用作训练,然而这些已标注数据中存在人为无法判断的冗余,并且标注者也无法 ...
【技术保护点】
1.一种面向机器人抓取的数据主动式选择方法,其特征在于,面向机器人抓取的数据主动式选择方法主要分为两个分支,物体抓取方式检测分支以及数据选择策略分支,具体包括以下三个模块:/n(1)数据特征提取模块/n数据特征提取模块为卷积神经网络特征提取层,输入数据经过数据特征提取模块处理后将称为特征数据,提供给其他模块利用;/n(1.1)模块输入:/n本模块的输入在RGB图像和深度图像间进行随意选择,一共有三种输入方案:单RGB图像、单深度图像以及RGB与深度图像结合,对应的输入通道数分别为3通道、1通道和4通道,输入图像的长宽均为300像素;/n(1.2)模块结构:/n本模块采用三层 ...
【技术特征摘要】 【专利技术属性】
1.一种面向机器人抓取的数据主动式选择方法,其特征在于,面向机器人抓取的数据主动式选择方法主要分为两个分支,物体抓取方式检测分支以及数据选择策略分支,具体包括以下三个模块:
(1)数据特征提取模块
数据特征提取模块为卷积神经网络特征提取层,输入数据经过数据特征提取模块处理后将称为特征数据,提供给其他模块利用;
(1.1)模块输入:
本模块的输入在RGB图像和深度图像间进行随意选择,一共有三种输入方案:单RGB图像、单深度图像以及RGB与深度图像结合,对应的输入通道数分别为3通道、1通道和4通道,输入图像的长宽均为300像素;
(1.2)模块结构:
本模块采用三层卷积神经网络结构,卷积核的大小分别为9×9,5×5和3×3;输出通道数分别为32,16和8;数据特征提取模块每一层都由卷积层和激活函数组成,整个过程表述如下公式:
Out1=F(RGBD)(1)
Out2=F(Out1)(2)
Out3=F(Out2)(3)
其中,RGBD表示RGB图像与深度图像结合的4通道输入数据,F代表卷积层与激活函数的组合,Out1、Out2与Out3分别代表三层输出的特征图;在输入图像的长宽均为300像素的情况下,Out1的大小为100像素×100像素,Out2的大小为50像素×50像素,Out3的大小为25像素×25像素;
(2)抓取方式检测模块
本模块利用数据特征提取模块得到的最终特征图进行反卷积操作,将特征图还原到原输入大小,即300像素×300像素,得到最终的结果,即抓取值图、宽度图以及旋转角的正弦图与余弦图;根据这四张图像,得到物体抓取表示方法的中心点、宽度以及旋转角;
(2.1)模块输入:
本模块的输入是公式(3)中得到的特征图Out3;
(2.2)模块结构:
抓取方式检测模块包含三个反卷积层以及四个单独的卷积层;三个反卷积层的卷积核大小分别设置为3×3、5×5和9×9,四个单独的卷积层卷积核大小为2×2;此外,在进行反卷积操作之后,每一层还包括ReLU激活函数,以实现更有效的表示,而四个单独的卷积层将直接输出结果;这个过程表述为:
x=DF(Out3)(4)
p=P(x)(5)
技术研发人员:叶贤丰,杨鑫,尹宝才,魏博言,林虎,杜振军,
申请(专利权)人:大连理工大学,
类型:发明
国别省市:辽宁;21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。