基于深度学习的图像分块目标检测方法、系统及介质技术方案

技术编号:32356169 阅读:80 留言:0更新日期:2022-02-20 03:16
本发明专利技术实施例公开了基于深度学习的图像分块目标检测方法、系统及介质,其中方法包括:图像分割操作,包括将图像分割成若干含有目标信息的图像区域,得到分割图像;对训练图像进行所述图像分割操作,将得到的分割图像输入目标检测网络进行训练,得到目标检测模型;对待预测的图像进行所述图像分割操作,并将得到的分割图像输入所述目标检测模型,得到检测结果;将检测结果的分割图像进行拼接,以及将检测结果的坐标在拼接后的图像中进行映射。本发明专利技术实施例避免了将高分辨率图像压缩成低分辨率图像后损失大量图像细节信息。率图像后损失大量图像细节信息。率图像后损失大量图像细节信息。

【技术实现步骤摘要】
基于深度学习的图像分块目标检测方法、系统及介质


[0001]本专利技术涉及图像处理领域,特别涉及一种基于深度学习的图像分块目标检测方法、系统及介质。

技术介绍

[0002]目标检测的任务是找出图像中所有感兴趣的目标(物体),确定它们的位置和大小。由于各类物体有不同的外观,形状,姿态,加上成像时光照,遮挡等因素的干扰,目标检测一直是机器视觉领域最具有挑战性的问题。
[0003]根据任务需要,理解一张图像可以主要分为以下三个层次:一是分类(Classification),即是将图像结构化为某一类别的信息,用事先确定好的类别(string)或实例ID来描述图片。二是检测(Detection),分类任务关心整体,给出的是整张图片的内容描述,而检测则关注特定的物体目标,要求同时获得这一目标的类别信息和位置信息,检测给出的是对图片前景和背景的理解。三是分割(Segmentation),分割包括语义分割(semantic segmentation)和实例分割(instance segmentation),解决“每一个像素属于哪个目标物或场景”的问题。
[0004]物体检测过程中有很多不确定因素,如图像中物体数量不确定,物体有不同的外观、形状、姿态,加之物体成像时会有光照、遮挡等因素的干扰,导致检测算法有一定的难度。进入深度学习时代以来,物体检测发展主要集中在两个方向:two stage算法如R

CNN系列和onestage算法如YOLO、SSD等。两者的主要区别在于two stage算法需要先生成proposal(一个有可能包含待检物体的预选框),然后进行细粒度的物体检测。而one stage算法会直接在网络中提取特征来预测物体分类和位置。
[0005]其中,YOLO是单阶段检测算法,只需要输入卷积神经网络,就可以预测图片中所有的物体边框。YOLO把一张图片划分成了S
×
S个格子。这里的S不固定,可以根据实际情况自主决定。当S取值为7,整张图片被分割成7
×
7=49个格子(Cell),这些格子就像渔网的网眼一样,通过这个网眼能够检测到每一个物体。每个单元格预测两个bbox框,因此一张图片会产生98个bbox(bounding box)。
[0006]基于深度学习的目标检测方法被广泛应用于各个方面,如使用YOLO算法在课堂上检测学生的各种行为。目前传统算法只针对低分辨率进行目标检测,当摄像头分辨率一般为4k以上,图像所包含的信息巨大,将课室场景图像的分辨率从4k压缩至YOLO算法的标准图像大小会损失大量图像细节信息,模型准确率下降。

技术实现思路

[0007]本专利技术旨在至少解决现有技术中存在的技术问题之一。为此,本专利技术提出一种基于深度学习的图像分块目标检测方法,能够避免将高分辨率图像压缩成低分辨率图像后损失大量图像细节信息。
[0008]本专利技术还提出一种基于深度学习的图像分块目标检测系统。
[0009]本专利技术还提出一种实施上述基于深度学习的图像分块目标检测方法的计算机可读存储介质。
[0010]根据本专利技术的第一方面实施例的基于深度学习的图像分块目标检测方法,包括以下步骤:图像分割操作,包括将图像分割成若干含有目标信息的图像区域,得到分割图像;对训练图像进行所述图像分割操作,将得到的分割图像输入目标检测网络进行训练,得到目标检测模型;对待预测的图像进行所述图像分割操作,并将得到的分割图像输入所述目标检测模型,得到检测结果;将检测结果的分割图像进行拼接,以及将检测结果的坐标在拼接后的图像中进行映射。
[0011]根据本专利技术实施例的基于深度学习的图像分块目标检测方法,至少具有如下有益效果:本专利技术实施例将高分辨率图像进行预处理,将原图像分割成多块含有重要信息的图像区域,分别对每个分块进行目标检测,避免了将高分辨率图像压缩成低分辨率图像后损失大量图像细节信息。
[0012]根据本专利技术的一些实施例,所述图像分割操作包括:采用水平方向和垂直方向的直线对原图像进行分割。
[0013]根据本专利技术的一些实施例,所述对待预测的图像进行所述图像分割操作包括:对所述待预测的图像的分割线邻近部分进行目标检测,根据目标检测结果对所述待预测的图像进行分割;所述分割线邻近部分为包含有分割线且分割线平行于图像边界的预设大小的图像。
[0014]根据本专利技术的一些实施例,所述对待预测的图像进行所述图像分割操作包括:对所述待预测的图像分割时,根据目标检测结果,若目标体跨越两个区域,则对所述待预测的图像进行偏移划分;所述偏移划分包括:根据目标体的大小设置偏移位置的大小,根据偏移位置对图像进行划分。本实施例中,目标出现在分块的边界时,这种情况下将进行原始高分辨率下的重新画分,会根据当前目标所占框的大小,将平分规则替换成不平分的规则。根据新的分块规则进行分块的目标检测,避免造成目标物体的丢失或者影响识别准确性。
[0015]根据本专利技术的一些实施例,根据目标体的大小按照16的倍数进行偏置,计算偏移位置的大小。
[0016]根据本专利技术的一些实施例,所述将检测结果的坐标在拼接后的图像中进行映射包括:根据每个分割图像拼接后的位置和目标体在分割图像中的相对坐标,计算目标体在拼接后的图像中的绝对位置。
[0017]根据本专利技术的第二方面实施例的基于深度学习的图像分块目标检测系统,包括:图像分割模块,用于执行图像分割操作,包括将图像分割成若干含有目标信息的图像区域,得到分割图像;训练模块,用于将分割图像输入目标检测网络进行训练,得到目标检测模型;目标检测模块,用于将分割图像输入所述目标检测模型,得到检测结果;拼接模块,用于将检测结果的分割图像进行拼接,以及将检测结果的坐标在拼接后的图像中进行映射。
[0018]根据本专利技术实施例的基于深度学习的图像分块目标检测系统,至少具有如下有益效果:本专利技术实施例将高分辨率图像进行预处理,将原图像分割成多块含有重要信息的图像区域,分别对每个分块进行目标检测,避免了将高分辨率图像压缩成低分辨率图像后损失大量图像细节信息。
[0019]根据本专利技术的一些实施例,所述图像分割模块包括:偏移划分单元,用于根据目标
体的大小设置偏移位置的大小,根据偏移位置对图像进行划分。本实施例中,目标出现在分块的边界时,这种情况下将进行原始高分辨率下的重新画分,会根据当前目标所占框的大小,将平分规则替换成不平分的规则。根据新的分块规则进行分块的目标检测,避免造成目标物体的丢失或者影响识别准确性。
[0020]根据本专利技术的一些实施例,所述拼接模块包括:映射单元,用于根据每个分割图像拼接后的位置和目标体在分割图像中的相对坐标,计算目标体在拼接后的图像中的绝对位置。
[0021]根据本专利技术的第三方面实施例的计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本专利技术的第一方面实施例中任一项的方法。
[0022]由于本专利技术实施例的计算机可读存储介质上存储有用于执行如本专利技术第一方面中任本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的图像分块目标检测方法,其特征在于,包括以下步骤:图像分割操作,包括将图像分割成若干含有目标信息的图像区域,得到分割图像;对训练图像进行所述图像分割操作,将得到的分割图像输入目标检测网络进行训练,得到目标检测模型;对待预测的图像进行所述图像分割操作,并将得到的分割图像输入所述目标检测模型,得到检测结果;将检测结果的分割图像进行拼接,以及将检测结果的坐标在拼接后的图像中进行映射。2.根据权利要求1所述的基于深度学习的图像分块目标检测方法,其特征在于,所述图像分割操作包括:采用水平方向和垂直方向的直线对原图像进行分割。3.根据权利要求2所述的基于深度学习的图像分块目标检测方法,其特征在于,所述对待预测的图像进行所述图像分割操作包括:对所述待预测的图像的分割线邻近部分进行目标检测,根据目标检测结果对所述待预测的图像进行分割;所述分割线邻近部分为包含有分割线且分割线平行于图像边界的预设大小的图像。4.根据权利要求3所述的基于深度学习的图像分块目标检测方法,其特征在于,所述对待预测的图像进行所述图像分割操作包括:对所述待预测的图像分割时,根据目标检测结果,若目标体跨越两个区域,则对所述待预测的图像进行偏移划分;所述偏移划分包括:根据目标体的大小设置偏移位置的大小,根据偏移位置对图像进行划分。5.根据权利要求4所述的基于深度学习的图像分块目标检测方法,其特征...

【专利技术属性】
技术研发人员:胡建华杨忠明陈广意曾文英吴伟美
申请(专利权)人:广东科学技术职业学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1