一种面向机器人抓取的数据主动式选择方法技术

技术编号：27977132 阅读：33 留言：0更新日期：2021-04-06 14:11

本发明专利技术属于计算机视觉技术领域，提供了一种面向机器人抓取的数据主动式选择方法，主要分为两个分支，物体抓取方式检测分支以及数据选择策略分支，包括数据特征提取模块、抓取方式检测模块和数据选择策略模块。本发明专利技术的核心内容为数据选择策略模块，该模块共享主干网络的特征提取层，并融合了三个不同大小感受野的特征，充分利用特征提取模块的同时，大大减少了需要添加的参数量。在主干的抓取方式检测网络模型训练过程中，数据选择策略模块可以进行同步的训练，从而形成端到端的模型。本发明专利技术利用了天然存在的标注、未标注标签，充分利用了已标注数据以及未标注数据，在已标注数据量较小时，仍然可以对网络进行更加充分的训练。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向机器人抓取的数据主动式选择方法
本专利技术属于计算机视觉
，尤其涉及基于深度学习、利用主动式学习减少数据标注成本的方法。
技术介绍
机器人抓取方式检测是一个具有重要应用意义的计算机视觉研究课题，它旨在给定一个场景的情况下，分析其中所包含物体的抓取方式，并选择最佳的抓取方式进行抓取。随着深度卷积神经网络(DeepConvolutionalNeuralNetworks,DCNNs)在计算机视觉领域的显著发展，其优秀的学习能力也被大量应用于机器人抓取方式检测研究。然而，相较于一般计算机视觉问题，例如目标检测、语义分割等，机器人抓取方式检测具有两个不可或缺的要求。一是该任务对于实时性的要求，若无法达到实时检测的效果，则该方法也毫无应用价值。二是该任务在陌生环境中所需的学习成本，不同环境中的物体多种多样，若要一个方法更好地应用于一个陌生环境中，那么需要重新获取数据、标注数据并训练以获得更令人满意的检测结果。当前的深度学习方法需要大量已标注的数据用作训练，然而这些已标注数据中存在人为无法判断的冗余，并且标注者也无法断定哪一份数据能够更好地提升深度学习网络的性能。主动式学习旨在利用策略从未标注数据中选择出最具有信息量的数据，提供给标注者进行标注，尽可能压缩需要标注的数据量，同时保证深度学习网络的训练效果，从而减少标注数据所需的成本。主动式学习的理念与机器人抓取方式检测的第二点要求十分契合，其为机器人抓取方式检测方法在陌生环境中的迁移提供了有效的保障。接下来详细介绍机器人抓取方式检测与主动式学习中的相关
技术介绍
...

【技术保护点】
1.一种面向机器人抓取的数据主动式选择方法，其特征在于，面向机器人抓取的数据主动式选择方法主要分为两个分支，物体抓取方式检测分支以及数据选择策略分支，具体包括以下三个模块：/n(1)数据特征提取模块/n数据特征提取模块为卷积神经网络特征提取层，输入数据经过数据特征提取模块处理后将称为特征数据，提供给其他模块利用；/n(1.1)模块输入：/n本模块的输入在RGB图像和深度图像间进行随意选择，一共有三种输入方案：单RGB图像、单深度图像以及RGB与深度图像结合，对应的输入通道数分别为3通道、1通道和4通道，输入图像的长宽均为300像素；/n(1.2)模块结构：/n本模块采用三层卷积神经网络结构，卷积核的大小分别为9×9，5×5和3×3；输出通道数分别为32，16和8；数据特征提取模块每一层都由卷积层和激活函数组成，整个过程表述如下公式：/nOut1＝F(RGBD) (1)/nOut2＝F(Out1) (2)/nOut3＝F(Out2) (3)/n其中，RGBD表示RGB图像与深度图像结合的4通道输入数据，F代表卷积层与激活函数的组合，Out1、Out2与Out3分别代表三层输出...

【技术特征摘要】
1.一种面向机器人抓取的数据主动式选择方法，其特征在于，面向机器人抓取的数据主动式选择方法主要分为两个分支，物体抓取方式检测分支以及数据选择策略分支，具体包括以下三个模块：
(1)数据特征提取模块
数据特征提取模块为卷积神经网络特征提取层，输入数据经过数据特征提取模块处理后将称为特征数据，提供给其他模块利用；
(1.1)模块输入：
本模块的输入在RGB图像和深度图像间进行随意选择，一共有三种输入方案：单RGB图像、单深度图像以及RGB与深度图像结合，对应的输入通道数分别为3通道、1通道和4通道，输入图像的长宽均为300像素；
(1.2)模块结构：
本模块采用三层卷积神经网络结构，卷积核的大小分别为9×9，5×5和3×3；输出通道数分别为32，16和8；数据特征提取模块每一层都由卷积层和激活函数组成，整个过程表述如下公式：
Out1＝F(RGBD)(1)
Out2＝F(Out1)(2)
Out3＝F(Out2)(3)
其中，RGBD表示RGB图像与深度图像结合的4通道输入数据，F代表卷积层与激活函数的组合，Out1、Out2与Out3分别代表三层输出的特征图；在输入图像的长宽均为300像素的情况下，Out1的大小为100像素×100像素，Out2的大小为50像素×50像素，Out3的大小为25像素×25像素；
(2)抓取方式检测模块
本模块利用数据特征提取模块得到的最终特征图进行反卷积操作，将特征图还原到原输入大小，即300像素×300像素，得到最终的结果，即抓取值图、宽度图以及旋转角的正弦图与余弦图；根据这四张图像，得到物体抓取表示方法的中心点、宽度以及旋转角；
(2.1)模块输入：
本模块的输入是公式(3)中得到的特征图Out3；
(2.2)模块结构：
抓取方式检测模块包含三个反卷积层以及四个单独的卷积层；三个反卷积层的卷积核大小分别设置为3×3、5×5和9×9，四个单独的卷积层卷积核大小为2×2；此外，在进行反卷积操作之后，每一层还包括ReLU激活函数，以实现更有效的表示，而四个单独的卷积层将直接输出结果；这个过程表述为：
x＝DF(Out3)(4)
p＝P(x)(5)

【专利技术属性】
技术研发人员：叶贤丰，杨鑫，尹宝才，魏博言，林虎，杜振军，
申请(专利权)人：大连理工大学，
类型：发明
国别省市：辽宁;21

全部详细技术资料下载我是这个专利的主人