一种基于三维正交注意力的CT图像目标检测方法技术

技术编号：40473446 阅读：12 留言：0更新日期：2024-02-26 19:10

本发明专利技术公开了一种基于三维正交注意力的CT图像目标检测方法，包括如下步骤：构建CT图像数据集，并对CT图像数据集进行数据预处理；将预处理后的CT图像数据集划分为训练集、验证集和测试集，并对训练集和验证集任务形式化；构建CT图像目标检测模型；CT图像目标检测模型由特征提取主干网络、CT图像检测模块、假阳性减少模块和CT图像分割模块组成；使用训练集和验证集对CT图像目标检测模型进行训练，得到训练后的CT图像目标检测模型，将测试集输入训练后的CT图像目标检测模型中，输出CT分割图像；本发明专利技术通过不同任务共享特征提取主干网络能够极大的解决训练多个三维卷积神经网络耗费时间和资源的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及神经网络图像处理，具体为一种基于三维正交注意力的ct图像目标检测方法。

技术介绍

1、随着计算机视觉和医学影像处理的发展，ct（computed tomography）图像在医学领域中被广泛使用。在ct图像中，准确地定位和识别感兴趣的目标对于疾病的早期检测和治疗至关重要。目前，传统的ct图像目标检测与分割方法主要依赖于手工设计的特征提取器和分类器，这些方法在处理复杂场景和多样化的目标上存在一定的局限性，同时，ct图像数据的三维特点（空间、深度和通道维度）也需要更好地被利用；近年来，注意力机制在计算机视觉领域取得了显著的进展，它可以帮助模型自动关注重要的特征，从而提高任务的准确性；然而，传统的二维注意力机制无法充分利用ct图像数据的三维特点；因此，引入三维正交注意力机制成为一种有潜力和创新的解决方案。

技术实现思路

1、针对现有技术的不足，本专利技术提供了一种基于三维正交注意力的ct图像目标检测方法，其目的在于解决
技术介绍
中所提到的问题。

2、为实现上述目的，本专利技术提供如下技术方案：一种基于三维正交注意力的ct图像目标检测方法，包括如下步骤：

3、步骤s1：构建ct图像数据集，并对ct图像数据集进行数据预处理，得到预处理后的ct图像数据集；

4、步骤s2：将预处理后的ct图像数据集划分为训练集、验证集和测试集，并对训练集和验证集任务形式化，得到任务形式化后的训练集和验证集；

5、步骤s3：构建ct图像目标检测模型；ct

6、特征提取主干网络依次由第一个编码块、第二个编码块、第一个三维正交注意力编码块、第二个三维正交注意力编码块、第三个编码块、第一个解码块和第二个解码块组成；其中，第一个编码块、第二个编码块、第三个编码块、第一个解码块和第二个解码块均由残差网络组成，第一个三维正交注意力编码块和第二个三维正交注意力编码块均由三个三维正交注意力模块组成；三维正交注意力模块均由三个1×1×1卷积层组成；

7、ct图像检测模块由两个3d卷积块组成，3d卷积块由一个3×3×3的三维卷积层和一个1×1×1卷积层组成；

8、假阳性减少模块由3d卷积块、重塑操作和全连接层组成；

9、ct图像分割模块由三个3×3×3卷积层和一个sigmoid激活函数组成；

10、步骤s4：使用任务形式化后的训练集和验证集对ct图像目标检测模型进行训练，得到训练后的ct图像目标检测模型，将测试集输入训练后的ct图像目标检测模型中，输出ct分割图像。

11、进一步的，构建ct图像数据集的具体过程为：采用多张ct图像构建ct图像数据集；

12、对ct图像数据集进行数据预处理的具体过程为：将ct图像数据集中的ct图像转换为亨氏单位，将转换后的ct图像裁剪至预设范围，将裁剪后的ct图像的范围线性转换为[-1,1]之间。

13、进一步的，步骤s4中将测试集输入训练后的ct图像目标检测模型中，输出的具体过程为：将测试集中的ct图像输入特征提取主干网络中得到低感受野特征图和主干网络提取特征图，将主干网络提取特征图输入ct图像检测模块得到多个预测的ct图像目标预测概率和ct图像目标预测边界框，其中，预测的ct图像目标预测概率为0至1之间的概率值越大，代表是真实ct图像目标的概率越大，ct图像目标预测边界框为ct图像目标的三维位置信息，包含ct图像目标的中心坐标x轴,y轴,z轴和ct图像目标的深度，高度，宽度六个参数，利用ct图像目标的三维位置信息提取低感受野特征图中所有ct图像目标的感兴趣区域组成3d感兴趣区域池，将3d感兴趣区域池输入假阳性减少模块得到预测的ct图像目标的二元分类概率，将主干网络提取特征图、低感受野特征图和测试集中的ct图像输入ct图像分割模块得到ct分割图像。

14、进一步的，得到低感受野特征图和主干网络提取特征图的具体过程为：将测试集中的ct图像输入第一个编码块得到ct图像的特征，将得到的ct图像的特征输入第二个编码块得到低感受野特征图，将低感受野特征图输入第一个三维正交注意力编码块得到第一个特征图，将第一个特征图输入第二个三维正交注意力编码块得到第二个特征图，将第二个特征图输入第三个编码块得到第三个特征图，将第三个特征图输入第一个解码块得到第四个特征图，将第四个特征图和第一个特征图进行拼接并输入第二个解码块中得到第五个特征图，将第五个特征图和低感受野特征图进行拼接得到主干网络提取特征图。

15、进一步的，得到多个预测的ct图像目标预测概率和ct图像目标预测边界框的具体过程为：将主干网络提取特征图输入至两个3d卷积块中分别输出多个预测的ct图像目标预测概率和ct图像目标预测边界框。

16、进一步的，得到预测的ct图像目标的二元分类概率的具体过程为：将3d感兴趣区域池输入3d卷积块得到3维的感兴趣区域图像特征，将3维的感兴趣区域图像特征输入重塑模块得到1维的感兴趣区域图像特征，将1维的感兴趣区域图像特征输入全连接层得到预测的ct图像目标的二元分类概率。

17、进一步的，得到ct分割图像的具体过程为：根据ct图像目标预测边界框从主干网络提取特征图中提取出ct图像目标的第一区域数据，将ct图像目标的第一区域数据输入第一个3×3×3卷积层得到ct图像目标的第一区域数据的第一分割特征，根据ct图像目标预测边界框从低感受野特征图中提取出ct图像目标的第二区域数据，将ct图像目标的第二区域数据和ct图像目标的第一区域数据的第一分割特征拼接后输入第二个3×3×3卷积层得到第二分割特征，根据ct图像目标预测边界框从测试集中的ct图像中提取出ct图像目标的第三区域数据，将ct图像目标的第三区域数据和第二分割特征进行拼接后输入第三个3×3×3卷积层后再经过sigmoid激活函数操作后得到ct分割图像。

18、进一步的，设为输入三维正交注意力编码块的特征图,其中c、d、h、w分别表示输入的特征图的数目，深度，高度和宽度；三维正交注意力编码块的定义为：

19、（1）；

20、式中，为三维正交注意力编码块的输出特征；为特征分组操作；分别为输入的特征图在x轴、y轴、z轴三个方向上的特征分组操作；g为三维正交注意力模块。

21、进一步的，所述特征分组操作采用两种方式：

22、短距离切片操作：将输入的特征图分为n组，相邻的张特征图的切片特征分为一组；

23、长距离切片操作：将间隔n张特征图的切片特征分为一组。

24、进一步的，三维正交注意力模块的定义如下：

25、（2）；

26、（3）；

27、式中，为可学习的权重矩阵；为点乘操作；、、表示为三个1×1×1卷积层；为批量归一化操作；

28、采用长距离切片操作和短距离切片操作分别在输入的特征图的x轴、y轴、z轴本文档来自技高网...

【技术保护点】

1.一种基于三维正交注意力的CT图像目标检测方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的一种基于三维正交注意力的CT图像目标检测方法，其特征在于：特征提取主干网络依次由第一个编码块、第二个编码块、第一个三维正交注意力编码块、第二个三维正交注意力编码块、第三个编码块、第一个解码块和第二个解码块组成；其中，第一个编码块、第二个编码块、第三个编码块、第一个解码块和第二个解码块均由残差网络组成，第一个三维正交注意力编码块和第二个三维正交注意力编码块均由三个三维正交注意力模块组成；三维正交注意力模块均由三个1×1×1卷积层组成；

3.根据权利要求2所述的一种基于三维正交注意力的CT图像目标检测方法，其特征在于：得到低感受野特征图和主干网络提取特征图的具体过程为：将测试集中的CT图像输入第一个编码块得到CT图像的特征，将得到的CT图像的特征输入第二个编码块得到低感受野特征图，将低感受野特征图输入第一个三维正交注意力编码块得到第一个特征图，将第一个特征图输入第二个三维正交注意力编码块得到第二个特征图，将第二个特征图输入第三个编码块得到第三个特征图，将第三个

4.根据权利要求3所述的一种基于三维正交注意力的CT图像目标检测方法，其特征在于：得到多个预测的CT图像目标预测概率和CT图像目标预测边界框的具体过程为：将主干网络提取特征图输入至两个3D卷积块中分别输出多个预测的CT图像目标预测概率和CT图像目标预测边界框。

5.根据权利要求4所述的一种基于三维正交注意力的CT图像目标检测方法，其特征在于：得到预测的CT图像目标的二元分类概率的具体过程为：将3D感兴趣区域池输入3D卷积块得到3维的感兴趣区域图像特征，将3维的感兴趣区域图像特征输入重塑模块得到1维的感兴趣区域图像特征，将1维的感兴趣区域图像特征输入全连接层得到预测的CT图像目标的二元分类概率。

6.根据权利要求5所述的一种基于三维正交注意力的CT图像目标检测方法，其特征在于：得到CT分割图像的具体过程为：根据CT图像目标预测边界框从主干网络提取特征图中提取出CT图像目标的第一区域数据，将CT图像目标的第一区域数据输入第一个3×3×3卷积层得到CT图像目标的第一区域数据的第一分割特征，根据CT图像目标预测边界框从低感受野特征图中提取出CT图像目标的第二区域数据，将CT图像目标的第二区域数据和CT图像目标的第一区域数据的第一分割特征拼接后输入第二个3×3×3卷积层得到第二分割特征，根据CT图像目标预测边界框从测试集中的CT图像中提取出CT图像目标的第三区域数据，将CT图像目标的第三区域数据和第二分割特征进行拼接后输入第三个3×3×3卷积层后再经过sigmoid激活函数操作后得到CT分割图像。

7.根据权利要求6所述的一种基于三维正交注意力的CT图像目标检测方法，其特征在于：设为输入三维正交注意力编码块的特征图,其中C、D、H、W分别表示输入的特征图的数目，深度，高度和宽度；三维正交注意力编码块的定义为：

8.根据权利要求7所述的一种基于三维正交注意力的CT图像目标检测方法，其特征在于：所述特征分组操作采用两种方式：

9.根据权利要求8所述的一种基于三维正交注意力的CT图像目标检测方法，其特征在于：三维正交注意力模块的定义如下：

...

【技术特征摘要】

1.一种基于三维正交注意力的ct图像目标检测方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的一种基于三维正交注意力的ct图像目标检测方法，其特征在于：特征提取主干网络依次由第一个编码块、第二个编码块、第一个三维正交注意力编码块、第二个三维正交注意力编码块、第三个编码块、第一个解码块和第二个解码块组成；其中，第一个编码块、第二个编码块、第三个编码块、第一个解码块和第二个解码块均由残差网络组成，第一个三维正交注意力编码块和第二个三维正交注意力编码块均由三个三维正交注意力模块组成；三维正交注意力模块均由三个1×1×1卷积层组成；

3.根据权利要求2所述的一种基于三维正交注意力的ct图像目标检测方法，其特征在于：得到低感受野特征图和主干网络提取特征图的具体过程为：将测试集中的ct图像输入第一个编码块得到ct图像的特征，将得到的ct图像的特征输入第二个编码块得到低感受野特征图，将低感受野特征图输入第一个三维正交注意力编码块得到第一个特征图，将第一个特征图输入第二个三维正交注意力编码块得到第二个特征图，将第二个特征图输入第三个编码块得到第三个特征图，将第三个特征图输入第一个解码块得到第四个特征图，将第四个特征图和第一个特征图进行拼接并输入第二个解码块中得到第五个特征图，将第五个特征图和低感受野特征图进行拼接得到主干网络提取特征图。

4.根据权利要求3所述的一种基于三维正交注意力的ct图像目标检测方法，其特征在于：得到多个预测的ct图像目标预测概率和ct图像目标预测边界框的具体过程为：将主干网络提取特征图输入至两个3d卷积块中分别输出多个预测的ct图像目标预测概率和ct图像目标预测边界框。

5.根据权利要求4所述的一种基于三维正交...

【专利技术属性】
技术研发人员：刘建明，李炫兵，
申请(专利权)人：江西师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人