本发明专利技术实施例提供了一种图像的处理方法和装置、存储介质及电子装置,该方法包括:获取目标图像;将目标图像输入到目标YOLOv5模型中,输出对目标图像的检测结果,其中,目标YOLOv5模型中至少包括目标focus结构,目标focus结构包括由一个Slice层组成的第一切片层、由两个Concat层组成的第一拼接层、由两个Slice层组成的第二切片层、由四个Concat层组成的第二拼接层和由一个Concat层组成的第三拼接层;将检测结果返回至客户端,通过本发明专利技术,解决了相关技术中的YOLOv5模型中的focus结构复杂,计算量大,导致YOLOv5模型对图像中目标对象的检测效率比较低的问题。对象的检测效率比较低的问题。对象的检测效率比较低的问题。
【技术实现步骤摘要】
图像的处理方法和装置、存储介质及电子装置
[0001]本专利技术实施例涉及图像处理
,具体而言,涉及一种图像的处理方法和装置、存储介质及电子装置。
技术介绍
[0002]随着深度学习领域的高速发展,各种目标检测算法孕育而生;但是在早期的目标检测算法一般都是通过提取图片一些robust的特性(HOG,Histogram of Oriented Gradient一种特征描述子、SIFT,Scale
‑
invariant feature transform尺度不变特征变换、Harr,Haar
‑
like features哈尔特征等等特性)。后面使用Deformable Parts Model模型,用silding window的方式预测检测框,能够获得较高score的bounding box,但是这种方式特别耗时,并且精度也不高。后面出现object proposal的方法,相较于silding window这种穷举的方法而言,不仅减少了大量的计算,而且在性能上也有很高的提升;再后面基于R
‑
CNN网络的发展,yolo网络孕育而生,yolo网络最大的特点就是通用性强、速度快并且准确率也比较高。YOLOv5中的Focus结构是一种特殊的下采样方式,它采用的是切片的方法把高分辨率的图片拆分成多个低分辨率的特征图,这样既能实现下采样的目的,又能保留图片的所有特性。但是现有的Focus结构复杂,增加了模块的复杂度和计算负担。
[0003]针对相关技术中的YOLOv5模型中的focus结构复杂,计算量,导致YOLOv5模型对图像中目标对象的检测效率比较低的问题,目前尚未提出有效的解决方案。
技术实现思路
[0004]本专利技术实施例提供了一种图像的处理方法和装置、存储介质及电子装置,以至少解决相关技术中的YOLOv5模型中的focus结构复杂,计算量,导致YOLOv5模型对图像中目标对象的检测效率比较低的问题。
[0005]根据本专利技术的一个实施例,提供了一种图像的处理方法,包括:获取目标图像,其中,所述目标图像中至少包括待检测的目标对象的信息;将所述目标图像输入到目标YOLOv5模型中,输出对所述目标图像的检测结果,其中,所述目标YOLOv5模型中至少包括目标focus结构,所述目标focus结构包括由一个Slice层组成的第一切片层、由两个Concat层组成的第一拼接层、由两个Slice层组成的第二切片层、由四个Concat层组成的第二拼接层和由一个Concat层组成的第三拼接层,其中,所述检测结果至少包括:带有对所述待检测的目标对象的标注信息和所述待检测的目标对象的预测类别信息;将所述检测结果返回至客户端。
[0006]在一个示例性实施例中,在所述目标focus结构中,所述第一切片层与所述第一拼接层连接,所述第一拼接层与所述第二切片层连接,所述第二切片层与所述第二拼接层连接,所述第二拼接层与所述第三拼接层连接。
[0007]在一个示例性实施例中,所述目标YOLOv5模型还包括:主干网络、Neck网络和预测网络,其中,所述主干网络由所述目标focus结构和CSP结构组成。
[0008]在一个示例性实施例中,将所述目标图像输入到目标YOLOv5模型中,输出对所述目标图像的检测结果包括:通过所述主干网络对所述目标图像进行特征提取,得到第一目标特征信息;通过所述Neck网络对所述第一目标特征信息中的特征信息进行处理,得到第二目标特征信息;通过所述预测网络对所述第二目标特征信息进行检测,生成所述检测结果。
[0009]在一个示例性实施例中,通过所述主干网络对所述目标图像进行特征提取,得到第一目标特征信息包括:通过所述目标focus结构对所述目标图像进行处理,得到初始特征信息;通过所述CSP结构对所述初始特征信息进行处理,得到所述第一目标特征信息。
[0010]在一个示例性实施例中,通过所述目标focus结构对所述目标图像进行处理,得到初始特征信息包括:通过所述第一切片层中的第一Slice层对所述目标图像在H维度进行切片处理,得到第一特征信息;通过所述第一拼接层中的Concat层对所述第一特征信息中的特征信息进行拼接处理,得到第二特征信息和第三特征信息,其中,所述第二特征信息为所述第一特征信息中的偶序列的特征信息,所述第三特征信息为所述第一特征信息中的奇序列的特征信息;通过所述第二切片层中的第二Slice层对所述第二特征信息在W维度进行切片处理,得到第四特征信息,并通过所述第二切片层中的第三Slice层对所述第三特征信息在W维度进行切片处理,得到第五特征信息;通过所述第二拼接层中的Concat层对所述第四特征信息和所述第五特征信息进行处理,得到第六特征信息、第七特征信息、第八特征信息和第九特征信息,其中,所述第六特征信息为所述第四特征信息中的偶序列的特征信息,所述第七特征信息为所述第四特征信息中的奇序列的特征信息,所述第八特征信息为所述第五特征信息中的偶序列的特征信息,所述第九特征信息为所述第五特征信息中的奇序列的特征信息;通过所述第三拼接层中的Concat层对所述第六特征信息、所述第七特征信息、所述第八特征信息和所述第九特征信息进行拼接处理,得到所述初始特征信息。
[0011]在一个示例性实施例中,通过所述第二拼接层中的Concat层对所述第四特征信息和所述第五特征信息进行处理,得到第六特征信息、第七特征信息、第八特征信息和第九特征信息包括:通过所述第二拼接层中的Concat层对所述第四特征信息中的特征信息进行拼接处理,得到所述第六特征信息和所述第七特征信息;通过所述第二拼接层中的Concat层对所述第五特征信息中的特征信息进行拼接处理,得到所述第八特征信息和所述第九特征信息。
[0012]在一个示例性实施例中,在将所述检测结果返回至客户端之后,所述方法还包括:在所述客户端的目标界面上展示所述检测结果;若接收对所述检测结果的调整指令,则对所述检测结果进行调整,得到调整后的检测结果;依据所述调整后的检测结果优化所述目标YOLOv5模型。
[0013]根据本专利技术的另一个实施例,提供了一种图像的处理装置,包括:获取单元,用于获取目标图像,其中,所述目标图像中至少包括待检测的目标对象的信息;输入单元,用于将所述目标图像输入到目标YOLOv5模型中,输出对所述目标图像的检测结果,其中,所述目标YOLOv5模型中至少包括目标focus结构,所述目标focus结构包括由一个Slice层组成的第一切片层、由两个Concat层组成的第一拼接层、由两个Slice层组成的第二切片层、由四个Concat层组成的第二拼接层和由一个Concat层组成的第三拼接层,其中,所述检测结果至少包括:带有对所述待检测的目标对象的标注信息和所述待检测的目标对象的预测类别
信息;返回单元,用于将所述检测结果返回至客户端。
[0014]在一个示例性实施例中,在所述目标focus结构中,所述第一切片层与所述第一拼接层连接,所述第一拼接层与所述第二切片层连本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种图像的处理方法,其特征在于,包括:获取目标图像,其中,所述目标图像中至少包括待检测的目标对象的信息;将所述目标图像输入到目标YOLOv5模型中,输出对所述目标图像的检测结果,其中,所述目标YOLOv5模型中至少包括目标focus结构,所述目标focus结构包括由一个Slice层组成的第一切片层、由两个Concat层组成的第一拼接层、由两个Slice层组成的第二切片层、由四个Concat层组成的第二拼接层和由一个Concat层组成的第三拼接层,其中,所述检测结果至少包括:带有对所述待检测的目标对象的标注信息和所述待检测的目标对象的预测类别信息;将所述检测结果返回至客户端。2.根据权利要求1所述的方法,其特征在于,在所述目标focus结构中,所述第一切片层与所述第一拼接层连接,所述第一拼接层与所述第二切片层连接,所述第二切片层与所述第二拼接层连接,所述第二拼接层与所述第三拼接层连接。3.根据权利要求1所述的方法,其特征在于,所述目标YOLOv5模型还包括:主干网络、Neck网络和预测网络,其中,所述主干网络由所述目标focus结构和CSP结构组成。4.根据权利要求3所述的方法,其特征在于,将所述目标图像输入到目标YOLOv5模型中,输出对所述目标图像的检测结果包括:通过所述主干网络对所述目标图像进行特征提取,得到第一目标特征信息;通过所述Neck网络对所述第一目标特征信息中的特征信息进行处理,得到第二目标特征信息;通过所述预测网络对所述第二目标特征信息进行检测,生成所述检测结果。5.根据权利要求4所述的方法,其特征在于,通过所述主干网络对所述目标图像进行特征提取,得到第一目标特征信息包括:通过所述目标focus结构对所述目标图像进行处理,得到初始特征信息;通过所述CSP结构对所述初始特征信息进行处理,得到所述第一目标特征信息。6.根据权利要求5所述的方法,其特征在于,通过所述目标focus结构对所述目标图像进行处理,得到初始特征信息包括:通过所述第一切片层中的第一Slice层对所述目标图像在H维度进行切片处理,得到第一特征信息;通过所述第一拼接层中的Concat层对所述第一特征信息中的特征信息进行拼接处理,得到第二特征信息和第三特征信息,其中,所述第二特征信息为所述第一特征信息中的偶序列的特征信息,所述第三特征信息为所述第一特征信息中的奇序列的特征信息;通过所述第二切片层中的第二Slice层对所述第二特征信息在W维度进行切片处理,得到第四特征信息,并通过所述第二切片层中的第...
【专利技术属性】
技术研发人员:熊宇鹏,王康,刘德龙,陈波扬,
申请(专利权)人:浙江大华技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。