一种基于改进YOLOv5模型的结核杆菌检测方法技术

技术编号:37787284 阅读:12 留言:0更新日期:2023-06-09 09:17
本发明专利技术属于目标检测技术领域,具体涉及一种基于改进YOLO v5模型的结核杆菌检测方法,包括:将痰液样本中的结核杆菌图像输入到训练好的改进YOLOv5模型中;通过Backbone骨干网络中获取深层特征信息,得到不同深度的特征图;通过FPNs网络中进行上采样和特征融合后获得不同尺度的张量数据;不同尺度的张量数据通过Head头部分别预测目标的分类和预测框,得到检测结果。本发明专利技术通过使用改进的YOLOv5算法检测结核杆菌,较现有的SSD、Faster R

【技术实现步骤摘要】
一种基于改进YOLO v5模型的结核杆菌检测方法


[0001]本专利技术属于目标检测
,具体涉及一种基于改进YOLO v5模型的结核杆菌检测方法。

技术介绍

[0002]为了诊断结核病,在深度学习和医学图像领域结合检测研究的推动下,检测痰液样本中的结核杆菌的方法成为当前医学图像检测中一项前沿课题。传统检测结核杆菌的最快速准确的检测方法就是进行人工筛查,医生通过显微镜观察被染色后的结核杆菌,来诊断病人是否为结核病患者,但这种检测方法存在一些不足。首先,这种方法非常依赖相关人员的主观判断,要求相关人员具有丰富的检测结核杆菌的知识和经验。其次,对结核杆菌检测的相关工作是一种工作量大且易于疲劳的工作,相关人员容易发生漏检或错检的情况。因此基于深度学习的目标检测技术对结核杆菌进行检测从而对结核病进行诊断,具有重要的应用价值,是医学检测的重要发展方向。
[0003]随着深度学习和图像处理等在医学图像检测领域的飞速发展,使用计算机视觉中的目标检测算法来实现对结核杆菌的检测已经成为发展的必然趋势,大大提高了临床医生在短时间内对结核杆菌检测的效率。其中YOLOv5目标检测算法是近年目标检测方向一个经典的方法,用YOLOv5目标检测算法可以很好地完成对小目标的识别检测,用来检测结核杆菌,并且取得很好的效果。
[0004]YOLOv5目标检测算法检测结核杆菌仍达不到人工检测的准确率,未应用到实际的检测之中。并且当前的YOLOv5算法在识别具有复杂背景的痰液样本中的结核杆菌时还存在位置信息不足和识别不准确等问题。小目标检测仍是目标检测中最具有挑战性的任务之一,其中结核杆菌检测是一种标准的小目标检测。

技术实现思路

[0005]为解决上述技术问题,本专利技术提出一种基于改进YOLO v5模型的结核杆菌检测方法,包括以下步骤:
[0006]将痰液样本中的结核杆菌图像输入到训练好的改进YOLOv5模型中,检测图像中的结核杆菌;
[0007]所述改进YOLOv5模型包括:输入端、改进Backbone骨干网络、FPNs网络、Head头部;
[0008]所述改进YOLOv5模型的训练过程包括以下步骤:
[0009]S1:获取痰液样本中结核杆菌图像的数据集并对获取的数据进行标注和格式转化处理,对格式转化后的数据集进行训练集和数据集的划分;
[0010]S2:将训练集中的数据输入到改进YOLOv5模型的输入端进行预处理;
[0011]S3:将预处理后的图片输入到Backbone骨干网络中获取深层特征信息,得到不同深度的特征图;
[0012]S4:将不同深度的特征图输入到FPNs网络中进行上采样和特征融合后获得不同尺
度的张量数据;
[0013]S5:不同尺度的张量数据通过Head头部分别预测目标的分类和预测框;
[0014]S6:根据预测框与真实框选取正确的检测框,并使用非极大值抑制NMS方法剔除多余的预测框;
[0015]S7:根据检测结果来计算模型的损失函数,接着调整模型的参数,在损失函数值变化浮动或不再变小时,完成模型训练。
[0016]本专利技术的有益效果:
[0017]本专利技术通过使用改进的YOLOv5算法检测结核杆菌,较现有的SSD、Faster R

CNN算法有着更好的检测效果,能够在实际的痰液样本检测过程中精确识别出结核杆菌,提高医学领域对结核杆菌检测的效率,为疾病诊断提供重要帮助。
附图说明
[0018]图1为本专利技术的所述改进YOLOv5模型的训练过程流程图。
具体实施方式
[0019]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0020]一种基于改进YOLO v5模型的结核杆菌检测方法,包括:
[0021]将痰液样本中的结核杆菌图像输入到训练好的改进YOLOv5模型中,检测图像中的结核杆菌;
[0022]所述改进YOLOv5模型包括:输入端、改进Backbone骨干网络、FPNs网络、Head头部;
[0023]如图1所示,所述改进YOLOv5模型的训练过程包括以下步骤:
[0024]S1:获取痰液样本中结核杆菌图像的数据集并对获取的数据进行标注和格式转化处理,对格式转化后的数据集进行训练集和数据集的划分;
[0025]S2:将训练集中的数据输入到改进YOLOv5模型的输入端进行预处理;
[0026]S3:将预处理后的图片输入到Backbone骨干网络中获取深层特征信息,得到不同深度的特征图;
[0027]S4:将不同深度的特征图输入到FPNs网络中进行上采样和特征融合后获得不同尺度的张量数据;
[0028]S5:不同尺度的张量数据通过Head头部分别预测目标的分类和预测框;
[0029]S6:根据预测框与真实框选取正确的检测框,并使用非极大值抑制NMS方法剔除多余的预测框;
[0030]S7:根据检测结果来计算模型的损失函数,接着调整模型的参数,在损失函数值变化浮动或不再变小时,完成模型训练。
[0031]所述改进的Backbone骨干网络,包括:Focus模块和CSPDarknet53网络;
[0032]将CSPDarknet53网络最后一层的C3模块的每个BottleNeck模块中融入MHSA多头自注意力机制,得到CSPDarknet53网络最后一层的三个BottleNeck模块变为三个
BottleNeck Transformer模块;
[0033]图片通过改进的CSPDarknet53网络的Focus模块进行像素点划分,得到通道数不变、缩放为原来大小为四分之一的四个矩阵,将四个输入矩阵接着按照通道数组合起来输入CSPDarknet53网络,通过多层卷积和MHSA多头自注意力机制操作,输出160
×
160、80
×
80、40
×
40深度的特征图。
[0034]所述FPNs网络,包括:
[0035]使用160
×
160的大尺度检测层,80
×
80的中尺度检测层与40
×
40的小尺度检测层进行目标融合检测。
[0036]对痰液样本数据集中的结核杆菌进行标注,将标注后的图像存储为VOC数据集格式。
[0037]输入端对训练集中的数据进行预处理包括,包括:
[0038]对输入的图片进行随机水平翻转、色彩调整、多尺度输入、样本按比例混合、剪裁拼接处理,得到数据增强后的图像。
[0039]在不同尺度的特征图上通过Head头部预测目标的分类,包括:
[0040]不同尺度的张量数据经过通道数为6、3...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLO v5模型的结核杆菌检测方法,其特征在于,包括:将痰液样本中的结核杆菌图像输入到训练好的改进YOLOv5模型中,检测图像中的结核杆菌;所述改进YOLOv5模型包括:输入端、改进Backbone骨干网络、FPNs网络、Head头部;所述改进YOLOv5模型的训练过程包括以下步骤:S1:获取痰液样本中结核杆菌图像的数据集并对获取的数据进行标注和格式转化处理,对格式转化后的数据集进行训练集和数据集的划分;S2:将训练集中的数据输入到改进YOLOv5模型的输入端进行预处理;S3:将预处理后的图片输入到Backbone骨干网络中获取深层特征信息,得到不同深度的特征图;S4:将不同深度的特征图输入到FPNs网络中进行上采样和特征融合后获得不同尺度的张量数据;S5:不同尺度的张量数据通过Head头部分别预测目标的分类和预测框;S6:根据预测框与真实框选取正确的检测框,并使用非极大值抑制NMS方法剔除多余的预测框;S7:根据检测结果来计算模型的损失函数,接着调整模型的参数,在损失函数值变化浮动或不再变小时,完成模型训练。2.根据权利要求1所述的一种基于改进YOLO v5模型的结核杆菌检测方法,其特征在于,所述改进的Backbone骨干网络,包括:Focus模块和CSPDarknet53网络;将CSPDarknet53网络最后一层的C3模块的每个BottleNeck模块中融入MHSA多头自注意力机制,得到CSPDarknet53网络最后一层的三个BottleNeck模块变为三个BottleNeck Transformer模块;图片通过改进的CSPDarknet53网络的Focus模块进行像素点划分,得到通道数不变、缩放为原来大小为四分之一的四个矩阵,将四个输入矩阵接着按照通道数组合起来输入CSPDarknet53网络,通过多层卷积和MHSA多头自注意力机制操作,输出160
×
160、80
×
80、40
×
40深度的特征图。3.根据权利要求1所述的一种基于改进YOLO v5模型的结核杆菌检测方法,其特征在于,所述FPNs网络,包括:使用160
×
160的大尺度检测层,80
×
80的中尺度检测层与40
×
40的小尺度检测层进行目标融合检测。4.根据权利要求1所述的一种基于改进YOLO v5模型的结核杆菌检测方法,其特征在于,输入端对训练集中的数据进行预...

【专利技术属性】
技术研发人员:李永红周诚陶于祥李梓歆赵志强李腊全宛江城
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1