当前位置: 首页 > 专利查询>山东大学专利>正文

一种基于滑动窗口的目标检测位置矫正方法和装置制造方法及图纸

技术编号:20046661 阅读:73 留言:0更新日期:2019-01-09 04:43
本发明专利技术公开了一种基于滑动窗口的目标检测位置矫正方法和装置,设置滑动窗口的宽度和移动步幅,利用滑动窗口分割待检测目标的图像,得到若干个候选目标区域;将所有候选目标区域送入CNN神经网络进行训练处理,得到所有候选目标区域的置信度;选取置信度最大值与该最大值对应的索引区域为基准值;利用位置矫正方法与基准值对候选目标区域进行裁剪和组合,形成新的目标区域。本发明专利技术针对图像中单一目标,以卷积神经网络和滑动窗口为基础,给出了可组合、裁剪的定位方法,提高目标识别的准确度和速度。

【技术实现步骤摘要】
一种基于滑动窗口的目标检测位置矫正方法和装置
本专利技术涉及图像处理领域,具体涉及一种基于滑动窗口的目标检测位置矫正方法和装置。
技术介绍
众所周知,当前是信息时代,信息的获得、加工、处理以及应用都有了飞跃发展。人们认识世界的重要知识来源就是图像信息,在很多场合,图像所传送的信息比其他形式的信息更丰富、真切和具体。人眼与大脑的协作使得人们可以获取、处理以及理解视觉信息,人类利用视觉感知外界环境信息的效率很高。事实上,据一些国外学者所做的统计,人类所获得外界信息有80%左右是来自眼睛摄取的图像。由此可见,视觉作为人类获取外界信息的主要载体,计算机要实现智能化,就必须能够处理图像信息。尤其是近年来,以图形、图像、视频等大容量为特征的图像数据处理广泛应用于医学、交通、工业自动化等领域。近年来,机器学习受到学术和工程上的广泛关注。在机器学习中,卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种深度前馈人工神经网络,通常包括卷积层(convolutionlayer)、归一化层(normalizationlayer)、池化层(poolinglayer)和全连接层(本文档来自技高网...

【技术保护点】
1.一种基于滑动窗口的目标检测位置矫正方法,其特征是,包括以下步骤:设置滑动窗口的宽度和移动步幅,利用滑动窗口分割待检测目标的图像,得到若干个候选目标区域;将所有候选目标区域送入CNN神经网络进行训练处理,得到所有候选目标区域的置信度;选取置信度最大值与该最大值对应的索引区域为基准值;利用位置矫正方法与基准值对候选目标区域进行裁剪和组合,形成新的目标区域。

【技术特征摘要】
1.一种基于滑动窗口的目标检测位置矫正方法,其特征是,包括以下步骤:设置滑动窗口的宽度和移动步幅,利用滑动窗口分割待检测目标的图像,得到若干个候选目标区域;将所有候选目标区域送入CNN神经网络进行训练处理,得到所有候选目标区域的置信度;选取置信度最大值与该最大值对应的索引区域为基准值;利用位置矫正方法与基准值对候选目标区域进行裁剪和组合,形成新的目标区域。2.根据权利要求1所述的基于滑动窗口的目标检测位置矫正方法,其特征是,根据所有待检测物体的平均大小确定滑动窗口的宽度;滑动窗口的移动布幅小于等于滑动窗口宽度的一半。3.根据权利要求1所述的基于滑动窗口的目标检测位置矫正方法,其特征是,所述将所有候选目标区域送入CNN神经网络进行训练处理的步骤包括:将与目标区域相关率小于阈值I的候选目标区域作为噪音,将与目标区域相关率大于阈值I的候选目标区域作为目标,分别输入到CNN神经网络中训练;利用训练好的CNN神经网络得到所有候选目标区域的置信度。4.根据权利要求3所述的基于滑动窗口的目标检测位置矫正方法,其特征是,当噪音区域过多时,利用随机抽样方法随机删除多个噪音区域,或者删除相应训练集的图片。5.根据权利要求1所述的基于滑动窗口的目标检测位置矫正方法,其特征是,在CNN神经网络输出的所有置信度中,选取置信度最大值,将该置信度最大值与该置信度最大值对应的索引区域为基准值。6.根据权利要求1所述的基于滑动窗口的目标检测位置矫正方法,其特征是,根据滑动...

【专利技术属性】
技术研发人员:赵梦莹张俊男李睿豪潘煜贾智平蔡晓军
申请(专利权)人:山东大学
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1