【技术实现步骤摘要】
一种基于改进自注意力机制的目标检测方法及装置
[0001]本专利技术属于医学影像
,具体涉及一种基于改进自注意力机制的目标检测方法及装置。
技术介绍
[0002]近年来,目标检测技术在图像处理领域取得了巨大成功。基于深度学习技术,学者们提出了多种目标检测算法。从结构上来看,主要分为两大类:一类算法是基于候选区域的,如R
‑
CNN,FastR
‑
CNN和FasterR
‑
CNN等;另一类是无候选区域的单阶段方法,如CenterNet,SSD等。相比于自然图像领域,在医学图像中,病变区域与整个图像相比可能非常小;而且通常图像结构复杂,仅根据单帧图像无法判断病灶。因此,在自然图像领域效果很好的2D目标检测方法在医学图像上通常无法达到预期效果。而如果在医学图像上采用全卷积网络,利用3D卷积获取上下文信息,则通常感受野不够大,而且显存占用很高。另外,为了快速地扩大感受野,CNN中往往使用大量的下采样操作,这使得最终得到的包含语义特征的特征图分辨率较低,不利于小物体检测。 />[0003]自注本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于改进自注意力机制的目标检测方法,其特征在于,包括以下步骤:获取维度为1*D*H*W的3D医学图像,D、H、W分别为深度、高度和宽度;将所述图像输入到3D卷积神经网络进行特征提取,得到一个维度为C*D*H*W的特征图,C为通道数;将所述特征图分成两个C/2*D*H*W的特征图,并将两个特征图分别沿横向和纵向划分为大小为D*C/2*H/n*W的n个方块和大小为D*C/2*H*W/m的m个方块,然后对划分后的两个特征图分别进行横向自注意力机制操作和纵向自注意力机制操作;将横向自注意力机制和纵向自注意力机制的输出拼接后进行特征融合,并将融合特征输入分类器,得到目标类别及位置大小。2.根据权利要求1所述的基于改进自注意力机制的目标检测方法,其特征在于,所述医学图像为CT或MRI。3.根据权利要求1所述的基于改进自注意力机制的目标检测方法,其特征在于,横向自注意力机制操作表示为:输入为:输出为:输出为:式中,分别为沿Q、K、V的投影矩阵,均为可学...
【专利技术属性】
技术研发人员:柏慧屏,刘小青,俞益洲,李一鸣,乔昕,潘晶,应汉宁,蔡秀军,
申请(专利权)人:杭州深睿博联科技有限公司浙江大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。