【技术实现步骤摘要】
一种基于滑动窗口的目标检测位置矫正方法和装置
本专利技术涉及图像处理领域,具体涉及一种基于滑动窗口的目标检测位置矫正方法和装置。
技术介绍
众所周知,当前是信息时代,信息的获得、加工、处理以及应用都有了飞跃发展。人们认识世界的重要知识来源就是图像信息,在很多场合,图像所传送的信息比其他形式的信息更丰富、真切和具体。人眼与大脑的协作使得人们可以获取、处理以及理解视觉信息,人类利用视觉感知外界环境信息的效率很高。事实上,据一些国外学者所做的统计,人类所获得外界信息有80%左右是来自眼睛摄取的图像。由此可见,视觉作为人类获取外界信息的主要载体,计算机要实现智能化,就必须能够处理图像信息。尤其是近年来,以图形、图像、视频等大容量为特征的图像数据处理广泛应用于医学、交通、工业自动化等领域。近年来,机器学习受到学术和工程上的广泛关注。在机器学习中,卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种深度前馈人工神经网络,通常包括卷积层(convolutionlayer)、归一化层(normalizationlayer)、池化层(poolingla ...
【技术保护点】
1.一种基于滑动窗口的目标检测位置矫正方法,其特征是,包括以下步骤:设置滑动窗口的宽度和移动步幅,利用滑动窗口分割待检测目标的图像,得到若干个候选目标区域;将所有候选目标区域送入CNN神经网络进行训练处理,得到所有候选目标区域的置信度;选取置信度最大值与该最大值对应的索引区域为基准值;利用位置矫正方法与基准值对候选目标区域进行裁剪和组合,形成新的目标区域。
【技术特征摘要】
1.一种基于滑动窗口的目标检测位置矫正方法,其特征是,包括以下步骤:设置滑动窗口的宽度和移动步幅,利用滑动窗口分割待检测目标的图像,得到若干个候选目标区域;将所有候选目标区域送入CNN神经网络进行训练处理,得到所有候选目标区域的置信度;选取置信度最大值与该最大值对应的索引区域为基准值;利用位置矫正方法与基准值对候选目标区域进行裁剪和组合,形成新的目标区域。2.根据权利要求1所述的基于滑动窗口的目标检测位置矫正方法,其特征是,根据所有待检测物体的平均大小确定滑动窗口的宽度;滑动窗口的移动布幅小于等于滑动窗口宽度的一半。3.根据权利要求1所述的基于滑动窗口的目标检测位置矫正方法,其特征是,所述将所有候选目标区域送入CNN神经网络进行训练处理的步骤包括:将与目标区域相关率小于阈值I的候选目标区域作为噪音,将与目标区域相关率大于阈值I的候选目标区域作为目标,分别输入到CNN神经网络中训练;利用训练好的CNN神经网络得到所有候选目标区域的置信度。4.根据权利要求3所述的基于滑动窗口的目标检测位置矫正方法,其特征是,当噪音区域过多时,利用随机抽样方法随机删除多个噪音区域,或者删除相应训练集的图片。5.根据权利要求1所述的基于滑动窗口的目标检测位置矫正方法,其特征是,在CNN神经网络输出的所有置信度中,选取置信度最大值,将该置信度最大值与该置信度最大值对应的索引区域为基准值。6.根据权利要求1所述的基于滑动窗口的目标检测位置矫正方法,其特征是,根据滑动...
【专利技术属性】
技术研发人员:赵梦莹,张俊男,李睿豪,潘煜,贾智平,蔡晓军,
申请(专利权)人:山东大学,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。