基于制造技术

技术编号:39840025 阅读:9 留言:0更新日期:2023-12-29 16:26
为解决现有技术宫颈癌细胞检测方法存在的需要更加关注细粒度特征和缺少端到端的检测模型等问题,本发明专利技术提出一种基于

【技术实现步骤摘要】
基于Yolov5l模型的宫颈癌细胞检测方法


[0001]本专利技术涉及到生物医学图像处理领域的宫颈癌细胞检测方法,特别涉及到一种基于
Yolov5l
模型的宫颈癌细胞检测方法


技术介绍

[0002]现有技术宫颈癌细胞检测方法需要对细胞核进行分割后再进行检测或分类,或者只进行检测或分类

为了检测或分类准确,有时需要人工手动构造特征,并以这些特征作为检测或分类的基础,如:细胞核与细胞质的比值,细胞核的直径,细胞核的染色深度等等

可见现有技术宫颈癌细胞检测方法的技术效果差强人意,缺少端到端的检测模型

所谓端到端的检测模型是指输入一张图片,经过隐式的特征提取即可得到输出结果的检测模型

产生上述困境的主要原因在于,宫颈细胞在形态

颜色等特征上的差异性远小于一般被检测物体之间的差异性,且不能很好区分,需要更加关注细粒度特征才能对宫颈细胞进行区分

另外,宫颈细胞学数据集来源少,标注信息不统一,在相当程度上增加了宫颈细胞检测任务的难度

[0003]Yolov5
是由
ultralytics
开发的目标检测算法模型系列之一,是基于“你只需要看一次”思想的第五个版本
(
以下简称
Yolov5
模型
)。(
名称中的
YOLO
,即英文
You Only Look Oncer/>的字头的组合
)。Yolov5
模型能够快速而准确地检测出图像中的多个物体,并输出其类别标签和位置坐标
。Yolov5
模型有微型
(n)、
小型
(s)、
中型
(m)、
大型
(l)
和加大型
(x)
等五种不同参数量大小
。Yolov5
模型可以在各种计算机设备和操作系统上运行,包括桌面计算机

服务器

嵌入式系统和云平台

它需要支持深度学习框架
(

PyTorch)
和相关的软件库
。Yolov5
模型在目标检测任务中具有较高的速度和准确性

[0004]显然,现有技术宫颈癌细胞检测方法存在着需要更加关注细粒度特征和缺少端到端的检测模型等问题


技术实现思路

[0005]为解决现有技术宫颈癌细胞检测方法存在的需要更加关注细粒度特征和缺少端到端的检测模型等问题,本专利技术提出一种基于
Yolov5l
模型的宫颈癌细胞检测方法

[0006]本专利技术基于
Yolov5l
模型的宫颈癌细胞检测方法,以大型
Yolov5
模型为检测网络的主体架构,即以
Yolov5l
为检测网络的主体架构,包括,网络主干
Backbone、
网络颈部
Neck
和检测层
Head
,其特征在于,在
Backbone
中的第六层后增加随机归零化多分支滑动窗口自注意力机制模块
DMBST
和卷积层
CBS
;其中,
DMBST

Droped Multi

branch Swin Transformer
的缩写;在
Neck
中增加若干个张量大小为
(762,20,20)
的特征图融合;在
Head
中增加张量大小为
(762,20,20)
的检测头
Detect
;所述随机归零化多分支滑动窗口自注意力机制模块
DMBST
的处理机制,包括:
[0007](1)
输入张量大小为
(c,h,w)
的特征图,将通道拆散成
n
等分作为每个分支的输入
(c/n,h,w)
;其中,
c
为图片通道数;
h
为图片高度,单位为像素;
w
为图片宽度,单位为像素;
n
为分支数;
[0008](2)
每个分支使用滑动窗口自注意力机制
Swin Transformer
提取全局注意力图;
[0009](3)
使用
LA
网络对图片通道数进行压缩;即先将输入的图像用卷积压缩到
r
通道,再次用卷积把它压缩到一个通道,最后通过逻辑回归函数
sigmoid
激活层,形成单张注意力图
FM
i
;并且,而有多少个分支就会有多少个注意力图
FM
i
;所述
LA
网络是指一个仅有3层的卷积神经网络,包含两个卷积层和一个激活函数层;
[0010](4)
随机分支归零化
Random Branch Dropout
,即随机对于某一分支的注意力图
FM
i
进行归零化,公式如下:
[0011][0012]式中,
i
是在0到
n
之间的随机数,
n
为分支数;即随机选取某一分支的特征图
FM
i
,随后让这个特征图矩阵等于一个全零矩阵;其中,特征图矩阵和全零矩阵的宽度均为
w
,单位为像素;高度均为
h
,单位为像素;
[0013](5)
由于每个分支都可能有不一样的注意力区域,需要对这几个注意力区域进行融合,因此,采用通道最大值化
Channel Maximize
将每个通道的注意力区域合并到一张注意力图中,即在所有的注意力图中,在通道这个维度上找出最大值,通道最大值化公式如下:
[0014]FM
merge(i,j)

Max(FM
0(i,j)
,FM
1(i,j)
,FM
2(i,j)
,...,FM
n(i,j)
),i∈[0,h],j∈[0,w][0015]式中,
FM
merge(i,j)
为最终融合的特征图矩阵的第
i



j
列的数值,它等于每一个分支的特征图上第
i
行,第
j
列的数值的最大值;这样做的目的是为了找出模型中所需要注意的区域;
[0016](6)
将输入的特征图矩阵进行点积,即矩阵对应位置上的数字直接相乘,最终输出张量大小为
(c,h,w)
本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于
Yolov5l
模型的宫颈癌细胞检测方法,以大型
Yolov5
模型为检测网络的主体架构,即以
Yolov5l
为检测网络的主体架构,包括,网络主干
Backbone、
网络颈部
Neck
和检测层
Head
,其特征在于,在
Backbone
中的第六层后增加随机归零化多分支滑动窗口自注意力机制模块
DMBST
和卷积层
CBS
;其中,
DMBST

Droped Multi

branch Swin Transformer
的缩写;在
Neck
中增加若干个张量大小为
(762,20,20)
的特征图融合;在
Head
中增加张量大小为
(762,20,20)
的检测头
Detect
;所述随机归零化多分支滑动窗口自注意力机制模块
DMBST
的处理机制,包括:
(1)
输入张量大小为
(c,h,w)
的特征图,将通道拆散成
n
等分作为每个分支的输入
(c/n,h,w)
;其中,
c
为图片通道数;
h
为图片高度,单位为像素;
w
为图片宽度,单位为像素;
n
为分支数;
(2)
每个分支使用滑动窗口自注意力机制
Swin Transformer
提取全局注意力图;
(3)
使用
LA
网络对图片通道数进行压缩;即先将输入的图像用卷积压缩到
r
通道,再次用卷积把它压缩到一个通道,最后通过逻辑回归函数
sigmoid
激活层,形成单张注意力图
FM
i
;并且,而有多少个分支就会有多少个注意力图
FM
i
;所述
LA
网络是指一个仅有3层的卷积神经网络,包含两个卷积层和一个激活函数层;
(4)
随机分支归零化
Random Branch Dropout
,即随机对于某一分支的注意力图
FM
i
进行归零化,公式如下:式中,
i
是在0到
n
之间的随机数,
n
为分支数;即随机选取某一分支的特征图
FM
i
,随后让这个特征图矩阵等于一个全零矩阵;其中,特征图矩阵和全零矩阵的宽度均为
w
,单位为像素;高度均为
h
,单位为像素;
(5)
由于每个分支都可能有不一样的注意力区域,需要对这几个注意力区域进行融合,因此,采用通道最大值化
Channel Maximize
将每个通道的注意力区域合并到一张注意力图中,即在所有的注意力图中,在通道这个维度上找出最大值,通道最大值化公式如下:
FM
merge(i,j)

Max(FM
0(i,j)
,FM
1(i,j)
,FM
2(i,j)
,...,FM
n(i,j)
),i∈[0,h],j∈[0,w]
式中,
FM
merge(i,j)
为最终融合的特征图矩阵的第
i



j
列的数值,它等于每一个分支的特征图上第
i

【专利技术属性】
技术研发人员:程宇晖刘丽蒋文轩熊明
申请(专利权)人:中国人民解放军陆军军医大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1