【技术实现步骤摘要】
水下机器人的目标检测方法、系统及相关设备
本专利技术涉及机器人视觉、模式识别与机器学习领域,具体涉及一种水下机器人的目标检测方法、系统及相关设备。
技术介绍
目标检测是一种从包含目标的序列图像中检测、识别目标的技术。机器人的场景目标检测是实现机器人与环境交互以及在未知环境中完成复杂智能任务的关键环节。实际应用中,由于目标所处场景的复杂性,遮挡、变形、光照以及尺度的变化等等都提升了检测任务的难度。目标检测在机器人视觉的许多领域都有应用,包括机器人在特定环境下的抓取任务、装配任务、探测任务等,一种鲁棒的机器人特定场景目标检测技术对该类任务有着重要的实际意义。传统的目标检测方法的一般流程为:(1)扫描图像。使用滑窗法,在待检测的窗口中不断移位滑动。这是一种穷举的策略,计算量巨大,而且在目标多尺度、多长宽比的情况下得到的效果较差。(2)特征提取。如Haar特征、局部二值模式(LocalBinaryPattern,LBP)特征、方向梯度直方图(HistogramofOrientedGradient,HOG)特征和SIFT特征等。每种特征的适用情况各有不同,特征的选取要视检测 ...
【技术保护点】
1.一种水下机器人的目标检测方法,其特征在于,包括以下步骤:步骤A1,获取原始的待检测图像;步骤A2,对所述原始的待检测图像进行像素值归一化,得到预处理后的待检图像;步骤A3,将所述预处理后的待检测图像输入目标检测网络进行检测,得到感兴趣区域的包围框和属于各目标类别的概率;步骤A4,根据所述感兴趣区域的包围框和属于各目标类别的概率,采用改进的非极大值抑制算法得到目标物体的包围框和所属类别;其中,所述改进的非极大值抑制算法包括:步骤A41,根据所有所述感兴趣区域属于各目标类别的概率,选择其中最大概率值对应的包围框,作为评分最高的包围框M;步骤A42,根据下式的方法,对除包围框 ...
【技术特征摘要】
1.一种水下机器人的目标检测方法,其特征在于,包括以下步骤:步骤A1,获取原始的待检测图像;步骤A2,对所述原始的待检测图像进行像素值归一化,得到预处理后的待检图像;步骤A3,将所述预处理后的待检测图像输入目标检测网络进行检测,得到感兴趣区域的包围框和属于各目标类别的概率;步骤A4,根据所述感兴趣区域的包围框和属于各目标类别的概率,采用改进的非极大值抑制算法得到目标物体的包围框和所属类别;其中,所述改进的非极大值抑制算法包括:步骤A41,根据所有所述感兴趣区域属于各目标类别的概率,选择其中最大概率值对应的包围框,作为评分最高的包围框M;步骤A42,根据下式的方法,对除包围框M以外的其他包围框进行重新评分:其中,si代表第i个包围框的评分值,初值为该包围框属于各目标类别的概率中最大概率值;bi代表第i个包围框,且不等于M;iou(M,bi)代表包围框M与bi的重叠度;N1代表第一重叠度阈值;步骤A43,遍历其他包围框,对所有与M的重叠度大于第二重叠度阈值N2的包围框进行删除操作;将包围框M作为一个目标物体的包围框,将该包围框的属于各目标类别的概率中最大概率值对应的目标类别作为该目标物体的类别;步骤A44,从余下的包围框中选择评分最高的包围框M,并转至步骤A42,直到处理完所有的包围框。2.根据权利要求1所述的目标检测方法,其特征在于,所述目标检测网络的构建与训练方法包括:步骤S10,构建检测器网络,所述检测器网络包括:可变形卷积神经网络、区域候选网络、池化层、第一全连接层、第二全连接层、第三全连接层、第四全连接层、softmax层;步骤S20,输入一帧训练样本图像;步骤S30,基于可变形卷积神经网络对所述训练样本图像进行特征图提取;步骤S40,根据提取的所述特征图,基于候选区域法进行目标检测;步骤S50,计算多任务损失函数;若所述多任务损失函数未收敛,则修改所述检测器网络的参数并转至步骤S20,否则转至步骤S60;步骤S60,使用剪枝方法对所述检测器网络进行稀疏化处理,得到所述目标检测网络。3.根据权利要求1所述的目标检测方法,其特征在于,在“输入一帧训练样本图像”之前,所述方法还包括:获取训练用的原始图像样本集;对所述样本集进行数据增广与像素值归一化,得到所述训练样本图像的集合。4.根据权利要求2所述的目标检测方法,其特征在于,步骤S40中“根据提取的所述特征图,基于候选区域法进行目标检测”具体包括:步骤S41,根据提取的所述特征图,通过区域候选网络计算感兴趣区域;步骤S42,根据提取的所述特征图,通过池化层对所述感兴趣区域进行池化操作,得到固定大小的特征图;根据所述固定大小的特征图,通过所述第一全连接层和所述第二全连接层提取所述感兴趣区域特征表示;步骤S43,根据所述感兴趣区域的特征表示,通过第三全连接层对感兴趣区域进行分类处理;根据所述分类处理的结果,通过softmax层计算每个感兴趣区域属于各目标类别的概率;步骤S44,根据所述感兴趣区域的特征表示,通过第四全连接层对包围框的位置偏差进行回归得到偏差值;其中,回归得到的偏差值为:x、y分别表示包围框的横、纵坐标值;w、h分别表示包围框的宽和高;k表示目标类别的序号,k=1,2,...,K;分别表示类别为k的包围框的x、y、w、h值偏差;所述感兴趣区域属于各目标类别的概率为:c=(c0,...,cK)K表示待检测目标的类别总数,c0表示感兴趣区域属于背景类别的概率值,c1、...、cK分别表示感兴趣区域属于第1、...、K类目标的概率。5.根据权利要求4所述的目标检测方法,其特征在于,所述多任务损失函数为:L(c,u,tu,v)=Lcls(c,u)+λ[u≥1]Lloc(tu,v)其中,c表示感兴趣区域的离散概率分布;u表示感兴趣区域的真实类别标签;...
【专利技术属性】
技术研发人员:刘智勇,张璐,杨旭,乔红,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。