The invention relates to a method for improving the accuracy of target detection performance improves target classification and localization by, its main technical characteristics are: according to the architecture of convolutional neural network image feature extraction, and select the layer M layer convolution output feature fusion, feature map form feature; mesh in convolution layer M, forecast the target candidate fixed number and the size of the box in each network; the candidate frame is mapped to a feature graph cut, and then cut the multi feature connection; the results through the whole connection layer, through the Softmax classification algorithm to classify the image features, and online Iterative Regression positioning in the overlapping area of loss function. To get the final detection result. The invention has reasonable design, through convolution neural network feature extraction, and the image features of multi-layer fusion, and finally use the Softmax classification algorithm to classify the image features, and the overlapping area loss function positioning, target are obtained good results.
【技术实现步骤摘要】
通过提高目标分类和定位准确度改善目标检测性能的方法
本专利技术属于目标检测
,尤其是一种通过提高目标分类和定位准确度改善目标检测性能的方法。
技术介绍
人类在物质世界的感知工程中,有80%以上的信息来源于视觉。而图像是在某种意义上对客观实际的一种反映,它以不同的模式向人类传递信息,并且它作为一种重要的信息载体,具有直观、内容丰富和便于交流等特点,是多媒体的重要组成内容,因此,基于图像处理技术的各种应用就应运而生。图像目标识别与检测技术就是其中最典型的应用技术。计算机视觉研究目的是用计算机来实现人类对客观世界的感知、识别和理解,目标检测(ObjectDetection)是计算机视觉中最常见的问题,且在计算机视觉理论研究领域受到了广泛关注,具有广阔的应用前景。当机器“睁”开双眼看世界时,需要判断它的视野内存在哪些目标、分别是什么、在什么位置。基于视觉的目标检测是图像处理、计算机视觉、模式识别等众多学科的交叉研究课题。目标检测的目的是从不同复杂程度的背景中辨识出目标,并以包围框(BoundingBox)的形式将其标示出,从而完成跟踪、识别等后续任务。因此,目标检测是高层理解与应用的基础任务,其性能的好坏将直接影响后续的目标跟踪、动作识别以及行为理解等中高层任务的性能。尤其是在复杂场景中,需要对多个目标进行实时处理时,目标自动提取和识别就显得特别重要。因此,目标检测与识别是图像分析和理解的基础,深入研究目标检测与识别算法,在学术界和工业界都有着非常重要的意义。然而对于机器而言,由于复杂的识别背景和目标本身的动态变化增加了目标识别的难度,庞大的系统参数和高维的 ...
【技术保护点】
一种通过提高目标分类和定位准确度改善目标检测性能的方法,其特征在于包括以下步骤:步骤1、根据卷积神经网络架构提取图像特征,并选择卷积层前M层输出进行特征融合,形成多特征的特征图;步骤2、在卷积层M上进行网格划分,在每个网络中预测固定数目和大小的目标候选框;步骤3、将候选框映射到特征图上进行裁剪,然后将裁剪结果进行多特征连接;步骤4、将上述结果通过全连接层后,通过Softmax分类算法对图像特征进行分类,并用重叠面积损失函数进行在线迭代回归定位,得到最终目标检测的结果。
【技术特征摘要】
1.一种通过提高目标分类和定位准确度改善目标检测性能的方法,其特征在于包括以下步骤:步骤1、根据卷积神经网络架构提取图像特征,并选择卷积层前M层输出进行特征融合,形成多特征的特征图;步骤2、在卷积层M上进行网格划分,在每个网络中预测固定数目和大小的目标候选框;步骤3、将候选框映射到特征图上进行裁剪,然后将裁剪结果进行多特征连接;步骤4、将上述结果通过全连接层后,通过Softmax分类算法对图像特征进行分类,并用重叠面积损失函数进行在线迭代回归定位,得到最终目标检测的结果。2.根据权利要求1所述的通过提高目标分类和定位准确度改善目标检测性能的方法,其特征在于:所述步骤1的具体方法包括以下步骤:⑴首先将带有物体真实包围框的图片输入到卷积神经网络架构中,通过Caffe提取图像通过卷积神经网络不同层的特征;⑵将靠前的卷积层输出的图像特征进行最大池化操作,并将卷积层M输出的图像特征进行反卷积操作,实现输出的尺寸都与中间卷积层的输出特征大小一致;⑶最后将所有卷积层输出的特征进行融合,得到图像的多特征提取的特征图。3.根据权利要求1所述的通过提高目标分类和定位准确度改善目标检测性能的方法,其特征在于:所述步骤2的实现方法包括以下步骤:⑴在卷积层M输出的特征图上进行6*6的网格划分;⑵在每个单个的网络小格正中间预测4个可能包含物体的候选框,这4个候选框具有固定的大小和长宽比,长宽比分别为1:1、1:2和2:1,仅对于1:1长宽比的候选框,设定2种候选框大小0.6和0.9;⑶在网...
【专利技术属性】
技术研发人员:娄英欣,周芸,付光涛,姜竹青,门爱东,
申请(专利权)人:国家新闻出版广电总局广播科学研究院,北京邮电大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。