一种基于滑动窗口的目标检测位置矫正方法和装置制造方法及图纸

技术编号：20046661 阅读：57 留言：0更新日期：2019-01-09 04:43

本发明专利技术公开了一种基于滑动窗口的目标检测位置矫正方法和装置，设置滑动窗口的宽度和移动步幅，利用滑动窗口分割待检测目标的图像，得到若干个候选目标区域；将所有候选目标区域送入CNN神经网络进行训练处理，得到所有候选目标区域的置信度；选取置信度最大值与该最大值对应的索引区域为基准值；利用位置矫正方法与基准值对候选目标区域进行裁剪和组合，形成新的目标区域。本发明专利技术针对图像中单一目标，以卷积神经网络和滑动窗口为基础，给出了可组合、裁剪的定位方法，提高目标识别的准确度和速度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于滑动窗口的目标检测位置矫正方法和装置
本专利技术涉及图像处理领域，具体涉及一种基于滑动窗口的目标检测位置矫正方法和装置。
技术介绍
众所周知，当前是信息时代，信息的获得、加工、处理以及应用都有了飞跃发展。人们认识世界的重要知识来源就是图像信息，在很多场合，图像所传送的信息比其他形式的信息更丰富、真切和具体。人眼与大脑的协作使得人们可以获取、处理以及理解视觉信息，人类利用视觉感知外界环境信息的效率很高。事实上，据一些国外学者所做的统计，人类所获得外界信息有80％左右是来自眼睛摄取的图像。由此可见，视觉作为人类获取外界信息的主要载体，计算机要实现智能化，就必须能够处理图像信息。尤其是近年来，以图形、图像、视频等大容量为特征的图像数据处理广泛应用于医学、交通、工业自动化等领域。近年来，机器学习受到学术和工程上的广泛关注。在机器学习中，卷积神经网络(ConvolutionalNeuralNetwork，CNN)是一种深度前馈人工神经网络，通常包括卷积层(convolutionlayer)、归一化层(normalizationlayer)、池化层(poolinglayer)和全连接层(full-connectedlayer)，已成功地应用于图像识别。现在，CNN已经成为众多科学领域的研究热点之一，特别是在模式分类领域，由于该网络避免了对图像的复杂前期预处理，可以直接输入原始图像并对图像进行分类等操作，因而得到了更为广泛的应用。目标检测是图像处理、目标识别领域的重要内容，其主要任务为从一幅给定图像中定位目标和分类，其中基于滑窗搜索的方法在目标检测中得到广泛应用...

【技术保护点】
1.一种基于滑动窗口的目标检测位置矫正方法，其特征是，包括以下步骤：设置滑动窗口的宽度和移动步幅，利用滑动窗口分割待检测目标的图像，得到若干个候选目标区域；将所有候选目标区域送入CNN神经网络进行训练处理，得到所有候选目标区域的置信度；选取置信度最大值与该最大值对应的索引区域为基准值；利用位置矫正方法与基准值对候选目标区域进行裁剪和组合，形成新的目标区域。

【技术特征摘要】
1.一种基于滑动窗口的目标检测位置矫正方法，其特征是，包括以下步骤：设置滑动窗口的宽度和移动步幅，利用滑动窗口分割待检测目标的图像，得到若干个候选目标区域；将所有候选目标区域送入CNN神经网络进行训练处理，得到所有候选目标区域的置信度；选取置信度最大值与该最大值对应的索引区域为基准值；利用位置矫正方法与基准值对候选目标区域进行裁剪和组合，形成新的目标区域。2.根据权利要求1所述的基于滑动窗口的目标检测位置矫正方法，其特征是，根据所有待检测物体的平均大小确定滑动窗口的宽度；滑动窗口的移动布幅小于等于滑动窗口宽度的一半。3.根据权利要求1所述的基于滑动窗口的目标检测位置矫正方法，其特征是，所述将所有候选目标区域送入CNN神经网络进行训练处理的步骤包括：将与目标区域相关率小于阈值I的候选目标区域作为噪音，将与目标区域相关率大于阈值I的候选目标区域作为目标，分别输入到CNN神经网络中训练；利用训练好的CNN神经网络得到所有候选目标区域的置信度。4.根据权利要求3所述的基于滑动窗口的目标检测位置矫正方法，其特征是，当噪音区域过多时，利用随机抽样方法随机删除多个噪音区域，或者删除相应训练集的图片。5.根据权利要求1所述的基于滑动窗口的目标检测位置矫正方法，其特征是，在CNN神经网络输出的所有置信度中，选取置信度最大值，将该置信度最大值与该置信度最大值对应的索引区域为基准值。6.根据权利要求1所述的基于滑动窗口的目标检测位置矫正方法，其特征是，根据滑动...

【专利技术属性】
技术研发人员：赵梦莹，张俊男，李睿豪，潘煜，贾智平，蔡晓军，
申请(专利权)人：山东大学，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人