【技术实现步骤摘要】
多尺度目标检测方法、装置、计算机设备及存储介质
本专利技术涉及图像识别领域,尤其涉及一种多尺度目标检测方法、装置、计算机设备及存储介质。
技术介绍
随着人工智能技术的不断发展,人们对计算机也提出了新的要求。除了学习围棋,人们希望计算机能自主检测生活中的物体,这促进了计算机视觉领域的发展和创新。计算机视觉是让机器拥有类似于人类的视觉能力,它是对输入的图像信息进行检测,对图像中的目标和环境进行认知,并给出相应的理解。计算机视觉是利用摄像头来模拟人观察这个世界,可是对世界的理解,还需要技术人员对摄像头收集到的信息进行处理。计算机视觉涉及的研究领域较多,如:目标检测、目标跟踪、场景理解、立体视觉和动作识别等。目标检测是计算机视觉领域中的研究热点。它是计算机根据视频帧或者图片检测出目标的位置和类别并进行标记。目标检测具有较强的实用价值,在安全防卫、交通监控、医疗诊断、国防军事以及日常生活等领域有着广泛的应用前景。目标检测在不同领域的应用,体现出它的实用性和广泛性。但目标检测还存在一定的不稳定性,这是视频中或者图像中环境变化、视角不同以及光线遮挡等都会造成目标的变化,增加目标 ...
【技术保护点】
1.一种多尺度目标检测方法,其特征在于,所述多尺度目标检测方法包括:获取初始图像;将所述初始图像放大形成图像金字塔,输入到预设的特征金字塔网络;通过所述预设的特征金字塔网络对所述初始图像中的目标进行识别和框选定位处理,得到第一预测结果;对所述初始图像按照预设方式进行放大处理,得到放大图像;将所述放大图像输入到预设的小尺度目标检测网络;通过所述预设的小尺度目标检测网络对所述放大图像进行特征提取和分类,得到第二预测结果;对所述第一预测结果和所述第二预测结果进行汇总分析,得到目标检测结果。
【技术特征摘要】
1.一种多尺度目标检测方法,其特征在于,所述多尺度目标检测方法包括:获取初始图像;将所述初始图像放大形成图像金字塔,输入到预设的特征金字塔网络;通过所述预设的特征金字塔网络对所述初始图像中的目标进行识别和框选定位处理,得到第一预测结果;对所述初始图像按照预设方式进行放大处理,得到放大图像;将所述放大图像输入到预设的小尺度目标检测网络;通过所述预设的小尺度目标检测网络对所述放大图像进行特征提取和分类,得到第二预测结果;对所述第一预测结果和所述第二预测结果进行汇总分析,得到目标检测结果。2.如权利要求1所述的多尺度目标检测方法,其特征在于,所述通过所述预设的特征金字塔网络对所述初始图像中的目标进行识别和框选定位处理,得到第一预测结果包括:通过对初始图像进行候选框特征提取,得到至少一种尺度的初始候选框;按照预设的分类器,对所述初始候选框进行分类,得到分类后的候选框;对所述分类后的候选框进行校正处理,得到所述第一预测结果。3.如权利要求2所述的多尺度目标检测方法,其特征在于,所述预设的特征金字塔网络包括输入层、卷积层和区域建议网络,所述卷积层包括第一预设卷积层和第二预设卷积层,通过对初始图像进行候选框特征提取,得到至少一种尺度的初始候选框包括:通过所述预设的特征金字塔网络的输入层提取所述初始图像中的多通道数据;采用所述卷积层对所述多通道数据进行特征提取,并对所述第一预设卷积层提取到的数据特征进行降维处理,得到第一特征,对所述第二预设卷积层提取到的数据特征进行降维处理,得到第二特征;采用双线性插值的方式,对所述第一特征进行双线性插值的上采样,得到上采样特征,并将所述上采样特征与所述第二特征进行求和,得到更新后的第二特征;使用所述区域建议网络,根据所述第一特征和所述更新后的第二特征,生成所述初始候选框。4.如权利要求2所述的多尺度目标检测方法,其特征在于,所述对所述分类后的候选框进行校正处理,得到所述第一预测结果包括:计算所述分类后的候选框与预设的真实框的欧式距离损失;根据所述欧式距离损失,对所述分类后的候选框的位置进行调整;返回所述计算所述分类后的候选框与真实框的欧式距离损失的步骤继续执行,直到所述欧式距离损失小于预设阈值,将得到的分类后的候选框作为所述第一预测结果。5.如权利要求1所述的多尺度目标检测方法,其特征在于,所述预设的小尺度目标检测网络为VGG16网络,所述通过所述预设的小尺度目标检测网络对所述放大图像进行特征提取和分类,得到第二预测结果包括:采用所述VGG16网络的卷...
【专利技术属性】
技术研发人员:方宝富,方帅,王浩,方璐,单文静,
申请(专利权)人:合肥工业大学,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。