【技术实现步骤摘要】
一种基于深度神经网络的抗遮挡的物体位姿估计方法
本专利技术属于物体位姿估计领域,涉及一种使用深度神经网络的具有强抗干扰性能的物体位姿估计的方法。
技术介绍
物体位姿涵盖了物体的全部空间信息,包括物体的位置信息和姿态信息。在现代工业生产生活等众多领域,物体的位姿信息具有着十分重要的意义,发挥着举足轻重的作用。准确估计物体的位姿信息是目前许多的工业应用的基础。例如,在机器人领域,对目标位置和姿态信息的准确获取是机器人视觉的主要任务也是其他后续抓取等操作任务的基础。在物联网自动驾驶领域,对障碍物位姿的精准估计是实现安全驾驶的前提和保证。因此准确快速的估计物体位姿具有十分重要的意义。与众多的深度学习的神经网络例如深度置信网络(DBN)、循环神经网络(RNN)相比,卷积神经网络(CNN)在处理图像信息方面有着显著的优势,因此卷积神经网络通常被用来处理与图像有关的应用。卷积核通过在特征图(featuremap)上滑动,提取图像上的信息。浅层次的featuremap可以获取图像纹理轮廓等直观信息,深层次的featuremap可以获 ...
【技术保护点】
1.一种基于深度神经网络的抗遮挡的物体位姿估计方法,包括下列步骤:/n第一步,利用3D建模软件自行构建带有标签的训练集图片数据库与测试集图片数据库。/n(1)构建圆柱形规则物体作为待估计目标,将棋盘格图标作为标识物;/n(2)将待估计目标置于目标相机前方,标识物处于相机视野中间,此时待估计目标的中心,标识物,相机镜头中心位于同一水平中心线,作为基准位置;/n(3)待待估计目标依照脚本进行运动与旋转,改变空间位置与姿态,抓取对应位姿下标识物相片,并将对应的六维度坐标作为训练样本的标签;/n(4)批量获取多张相片作为训练集样本,并将其标签进行所需的数据格式处理,满足网络输入的需 ...
【技术特征摘要】
1.一种基于深度神经网络的抗遮挡的物体位姿估计方法,包括下列步骤:
第一步,利用3D建模软件自行构建带有标签的训练集图片数据库与测试集图片数据库。
(1)构建圆柱形规则物体作为待估计目标,将棋盘格图标作为标识物;
(2)将待估计目标置于目标相机前方,标识物处于相机视野中间,此时待估计目标的中心,标识物,相机镜头中心位于同一水平中心线,作为基准位置;
(3)待待估计目标依照脚本进行运动与旋转,改变空间位置与姿态,抓取对应位姿下标识物相片,并将对应的六维度坐标作为训练样本的标签;
(4)批量获取多张相片作为训练集样本,并将其标签进行所需的数据格式处理,满足网络输入的需求;
(5)以相同的方式构建遮挡测试集,不同之处在于以0%,4%,9%,12%,16%,20%,25%的比例对标识物进行遮挡;
第二步,构建深度神经网络:该神经网络包含四个子分支网络,每个子分支是独立的卷积神经网络结构:由6层卷积层,4层最大池化层,1层展平层和3层密集连接层组成;其中每两层或者一层后跟随一层最大池化层,卷积核的数目依次是32,32,64,64,128,256.密集连接层的参数依次是2048,2048,6.
第三步,构建网络预测输出处理算法:四个子分支网络在最后一层密集连接层输出6维度的预测值,代表了待估计物体的位姿信息;由于遮挡的存在,某分支的结果存在误差,4个分支输出中存在着异常值,构建5种算法对其进行优化,提高抗遮挡干扰的能力;
(1)加权平均法:4个分支分别输出了对待估计目标的6维度预测值,把6个维度预测值分别对应相加求加权平均,得到6维度的预测值,并将其作为最后的输出;
(2)欧几里得距离法:分别考虑6个维度的估计值,针对每个维度:计算每个分支与其他3个分支在该维度上的平均欧几里得距离;设定平均欧几里得距离阈值;计算每个分支与平均欧几里得距离的差值,当该差值大于平均欧几里得距离阈值时,判定该分支在当前维度的预测值异常,将其删除;对剩余分支的预测值求...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。