基于双空间金字塔深度卷积网络的舌像分割方法技术

技术编号：40839674 阅读：2 留言：0更新日期：2024-04-01 15:05

本发明专利技术公开了基于双空间金字塔深度卷积网络的舌像分割方法，步骤一：通过相机和手机拍摄舌部图像，以提高数据集的泛化性；步骤二：对采集的图像进行去背景处理，得到无背景的参考图像；步骤三：构建基于双空间金字塔的深度卷积网络Deep‑DSP；通过构建基于双空间金字塔深度卷积网络Deep‑DSP，有效地提升了舌部图像分割的准确性；网络结构的设计允许更好地学习多重编码状态下的特征，从而更精确地分割舌头区域，有助于提高中医舌诊断的准确性；通过相机和手机的组合图像采集，以及采用去背景处理和手动裁剪的图像处理步骤，该方案有效地增强了数据集的泛化性；这使得模型更能适应不同光照条件、舌部异常情况和拍摄设备，提高了模型对不同舌部图像的通用性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于图像分割，具体涉及基于双空间金字塔深度卷积网络的舌像分割方法。

技术介绍

1、在传统中医诊断中，经验丰富的中医医生可以通过诊断患者的舌部图像来了解患者的潜在症状。随着计算机科学和人工智能的不断发展，神经网络逐渐被应用于图像处理和特征提取领域。在图像处理中，有两类分割。一种是基于图的图像分割，另一种是基于聚类的图像分割。

2、对于基于图的图像分割，根据图论将图映射到加权间接图中，将像素作为节点，将图像分割问题视为图的顶点划分。因此，根据最小切割准则得到最佳分割。通过修改了切割标准，以提高了图像分割的精度。具有代表性的方法有归一化割算法、图割算法和抓取割算法。然而，基于图形的算法在处理图像的复杂纹理特征时，仍然需要与用户进行交互。

3、通过迭代、像素在颜色、亮度和纹理上的像素相似度来实现聚类算法，并将其他特征聚类到相同的超像素上，得到最终的图像分割结果。与原始的k均值算法相比，光谱聚类将图引入到聚类中，得到了更准确的最优解。根据均值位移聚类，将具有相同模量点的像素分割到相同的区域。另一种聚类方法--简单线性迭代聚类(slic，simple lineariterative clustering)，从中将颜色图像转换为lab颜色空间以及xy颜色坐标组成的5维特征向量其中lab颜色空间包括亮度通道l、颜色通道a、颜色通道b。虽然基于聚类的方法获得了良好的分割结果，但时间复杂度和空间复杂度太大，无法应用于实际应用。

4、随着计算机和人工智能的发展，深度学习逐渐被应用到图像分割中，这给图像分割

5、因此，提出了一种基于双空间金字塔深度卷积网络的舌像分割方法，通过构建中医与神经网络相结合的智能舌诊断，自动提高诊断准确性。

技术实现思路

1、本专利技术的目的在于提供基于双空间金字塔深度卷积网络的舌像分割方法，以解决上述
技术介绍
中提出的问题。

2、为实现上述目的，本专利技术提供如下技术方案：基于双空间金字塔深度卷积网络的舌像分割方法，

3、步骤一：图像采集：通过相机和手机拍摄舌部图像，以提高数据集的泛化性，相机拍摄标准舌部图像，手机随机拍摄舌部图像，并确保图像缩放至相同像素；总共采集了500张舌前图像和56张舌背图像作为训练集；

4、步骤二：图像处理：对采集的图像进行去背景处理，得到无背景的参考图像；同原图参与到神经网络的训练中；

5、步骤三：构建基于双空间金字塔的深度卷积网络deep-dsp：双空间金字塔的深度卷积网络deep-dsp包括两个编码器、两个空间金字塔块、两个解码器，将图像输入编码器1后缩小至原有大小的1/4后，经中间流处理后同时输入空间金字塔块1和编码器2；

6、输入编码器2的图像缩小至输入大小的1/4后，通过空间金字塔块2处理的图像输入解码器1中；解码器1将输入图像放大4倍后与空间金字塔块1的输出图像通过合并模块融合后传入解码器2；解码器2的输出图像与未经编码器1处理的输入图像通过第二个合并模块融合后输入至最后的输出层获得网络输出的二值图像最后通过与原图的点积获得输出图片；

7、步骤四：模型训练：将经步骤一中430张舌前图像和50张不同特征的舌背图像作为训练集；其余70张舌前图像和6张舌背图像作为测试集；对步骤三构建的deep-dsp进行训练；将图像的大小调整为320×320，并使用自适应优化器对所提出的模型进行训练，并将输出图与参考图像之间的损失函数设为l1损失；学习速率初始化为1e-3，每100次迭代减少1e-6，提取100个循环周期后的结果；

8、步骤五：将任意舌部图像输入训练后的deep-dsp模型中，输出去除背景的舌部图像。

9、优选的，收集图像涵盖各种舌头异常，包括有涂层、裂缝。

10、优选的，步骤二中，使用photoshop手动裁剪图像，确保舌头区域的准确性；对舌图像进行多次操作，添加或裁剪选定的舌区；将选定的舌部区域和冗余背景区域的像素值保留到[0,0,0]，将获得的图像视为相应的参考图像。

11、优选的，编码器1包括3×3常规卷积层、批范数层和修正线性单元层，

12、tj+1＝srj(tj)＝r(b(1c3×3(tj,kej)))；其中srj代表涵盖常规卷积层的第j阶段，r代表修正线性单元，b代表批范数层，1c3×3代表3×3常规卷积层，kej代表卷积核，tj代表第j阶段输入图像，tj+1代表第j+1阶段输入图像也就是第j阶段输出图像。

13、优选的，编码器2包括3×3卷积层，具有与池化层相似的功能，具有训练能力，包括bn层和relu层，与编码器1相比，编码器2需要处理的图片长和宽均为编码器1处理图片的1/4；

14、其中spj代表涵盖步长为2的卷积层(被表示为1c23×3)的第j阶段；对i’∈rm×n×c,i∈r2m×2n×c若i’＝1c23×3(i,kej),(kej∈r3×3×c×c)相应位于i’的元素(x,y,z)(x∈1:m,y∈1:n,z∈1:c)满足：

15、每个编码器包括一个主干层和两个辅助层，主干层包括两个部分，其每个部分均由三个常规卷积模块构成；两个辅助层分别连接到主干层的前半部分和后半部分，由于辅助层卷积较浅，较于主干层更能够注重原始信息，通过增加辅助层的连接使得原始信息对编码影响有所增强；编码器tt＝cat(sp2·sr1·sr0·t0,sp0·t0)；其中cat代表合并模块，cat的前第一个输入代表主干层部分，第二个输入代表辅助层本文档来自技高网...

【技术保护点】

1.基于双空间金字塔深度卷积网络的舌像分割方法，其特征在于：

2.根据权利要求1所述的基于双空间金字塔深度卷积网络的舌像分割方法，其特征在于：收集图像涵盖各种舌头异常，包括有涂层、裂缝。

3.根据权利要求1所述的基于双空间金字塔深度卷积网络的舌像分割方法，其特征在于：步骤二中，使用PhotoShop手动裁剪图像，确保舌头区域的准确性；对舌图像进行多次操作，添加或裁剪选定的舌区；将选定的舌部区域和冗余背景区域的像素值保留到[0,0,0]，将获得的图像视为相应的参考图像。

4.根据权利要求3所述的基于双空间金字塔深度卷积网络的舌像分割方法，其特征在于：编码器1包括3×3常规卷积层、批范数层和修正线性单元层，

5.根据权利要求4所述的基于双空间金字塔深度卷积网络的舌像分割方法，其特征在于：编码器2包括3×3卷积层，具有与池化层相似的功能，具有训练能力，包括BN层和ReLU层，与编码器1相比，编码器2需要处理的图片长和宽均为编码器1处理图片的1/4；

6.根据权利要求5所述的基于双空间金字塔深度卷积网络的舌像分割方法，其特征在于

7.根据权利要求6所述的基于双空间金字塔深度卷积网络的舌像分割方法，其特征在于：空间金字塔块包括一个1×1卷积部分，三个3×3无卷积部分和一个池化部分；

8.根据权利要求7所述的基于双空间金字塔深度卷积网络的舌像分割方法，其特征在于：通过1×1卷积部分，三个3×3的卷积部分和一个池化部分实现多尺度语义分割，以上五部分的输出经合并模块充分融合后依次被3×3卷积层，BN层和ReLU层处理；

...

【技术特征摘要】

1.基于双空间金字塔深度卷积网络的舌像分割方法，其特征在于：

2.根据权利要求1所述的基于双空间金字塔深度卷积网络的舌像分割方法，其特征在于：收集图像涵盖各种舌头异常，包括有涂层、裂缝。

3.根据权利要求1所述的基于双空间金字塔深度卷积网络的舌像分割方法，其特征在于：步骤二中，使用photoshop手动裁剪图像，确保舌头区域的准确性；对舌图像进行多次操作，添加或裁剪选定的舌区；将选定的舌部区域和冗余背景区域的像素值保留到[0,0,0]，将获得的图像视为相应的参考图像。

4.根据权利要求3所述的基于双空间金字塔深度卷积网络的舌像分割方法，其特征在于：编码器1包括3×3常规卷积层、批范数层和修正线性单元层，

5.根据权利要求4所述的基于双空间金字塔深度卷积网络的舌像分割方法，其...

【专利技术属性】
技术研发人员：芦东昕，郑丹妮，柯文德，
申请(专利权)人：杭州师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人