一种基于信息损失区域检测机制的舌图像分割方法技术

技术编号：35149145 阅读：18 留言：0更新日期：2022-10-05 10:27

本发明专利技术涉及基于信息损失区域检测机制的舌图像分割方法，可有效解决现有技术分割出来的舌图像边缘会变得粗糙的问题，其解决的技术方案是，包括以下步骤：步骤1:收集舌图像数据集；步骤2:舌图像标注与预处理；步骤3:构建舌图像分割模型；步骤4：训练并测试舌图像分割模型；本发明专利技术方法可以有效地提高舌图像边缘区域分割的准确率，为后续舌诊辩证分析提供有效依据，是舌图像分割方法上的创新。是舌图像分割方法上的创新。是舌图像分割方法上的创新。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于信息损失区域检测机制的舌图像分割方法

[0001]本专利技术涉及计算机图像分割领域，特别是一种基于信息损失区域检测机制的舌图像分割方法。

技术介绍

[0002]中医是中国的文化智慧，其行之有效的实践方法，为中华民族的繁荣昌盛和健康发展做出了崇高贡献。中医学主要包括“望、闻、问、切”四种诊断方法，其中望诊是最有效、最直观的方法，人体内部器官通过经络与舌头相连，临床医生可以通过观察患者舌头的颜色、舌体形态等特征来辩证诊疗，这就是舌诊，属于望诊范畴。然而，由于传统的舌诊仅依赖于临床医生的经验积累，缺乏客观评价依据，且不可复制，因此舌诊客观化是当前中医药人工智能领域研究的热点。舌图像分割作为舌诊智能化的第一步，其分割质量将直接影响舌诊的客观化的结果。
[0003]传统的舌图像分割主要使用区域增长、边缘检测、分水岭等方法，但这些方法存在易受噪声的影响、需人工参与等因素影响，无法取得较好的分割效果。近几年，随着深度学习的发展，一些中医药人工智能研究领域的学者开始尝试将深度学习相关算法应用到舌图像分割中。比如，Lin等人提出基于ResNet端到端神经网络模型的舌图像分割方法，Li等人设计了一个基于UNet和迁移学习的舌图像分割框架，Gholami等人使用R
‑
CNN完成舌图像分割。从以上研究可知，深度学习方法在舌图像分割中展现出极好的性能，得到了广泛应用。
[0004]然而，当舌部颜色接近邻近区域如唇部、口腔内部颜色时，分割出来的舌图像边缘会变得粗糙，严重制约着临床医生的辩证诊疗分析。因此...

【技术保护点】

【技术特征摘要】
1.一种基于信息损失区域检测机制的舌图像分割方法，其特征在于，包括以下步骤：步骤1:收集舌图像数据集舌图像分割数据集主要用于训练、验证和测试网络模型，为提高网络模型的泛化性，数据集通过舌诊采集仪器、开源数据库下载和手机摄像头拍摄三种方式获得；步骤2:舌图像标注与预处理为使训练的网络模型分割准确率更好，需先用Labelme图像标注工具对步骤1收集到的舌像进行舌体轮廓标注，之后利用数据增强程序对标注后的舌图像随机进行旋转、平移、缩放、添加噪声进行预处理，扩充原来的舌图像数据集；步骤3:构建舌图像分割模型通过识别舌图像分割中容易出错的物体边界和高频区域，来提高舌图像分割的准确率；这些区域称之为信息损失区域，基于信息损失区域检测机制的舌图像分割主要包括：主干特征提取、构建特征金字塔、构建四叉树和基于Transformer的舌图像分割；步骤4：训练并测试舌图像分割模型在训练过程中，将随机排列每个待分割舌图像的信息损失区域的顺序，并保证每个待分割舌图像具有相同的序列长度，在测试过程中，首先使用四叉树识别信息损失区域，然后使用构建的舌图像分割模型预测四叉树中所有信息损失区域的精细分割结果，最后利用四叉树融合多个特征层级的预测结果，完成整个舌图像的分割。2.根据权利要求1所述的基于信息损失区域检测机制的舌图像分割方法，其特征在于，所述的步骤3中，主干特征提取采用ResNet101作为主干特征提取网络，为了防止舌图像失真和保证分割效果的精确，首先在原舌图像边缘加灰条并保证边长能够整除2的6次方，然后传入到主干特征提取网络处理，经过一系列的卷积、标准化和激活函数之后，舌图像的长和宽不断的进行压缩，获得多个共享特征层，也就是相当于把舌图像划分成多个网格。3.根据权利要求1所述的基于信息损失区域检测机制的舌图像分割方法，其特征在于，所述的步骤3中，构建特征金字塔的方法为：取出经过主干特征提取之后获得的共享特征层进行卷积、上采样，使舌图像特征不断变大，并和上级特征层进行组合，构造特征金字塔，获得有效特征层；提取到的有效特征层一部分作为区域生成网络的有效特征层，通过建议框的获取，生成粗略的分割结果，一部分用来构建ROI特征金字塔，作为后续四叉树的输入，实现高精度的舌图像分割。4.根据权利要求1所述的基于信息损失区域检测机制的舌图像分割方法，其特征在于，所述的步骤3中，构建四叉树的方法为：首先将最低层的ROI特征和初始的舌体mask预测作为输入，采用一个全卷积网络进行四个3
×
3卷积来预测四叉树的根结点，每个根结点分解到临近更高ROI层对应的4个子结点，对于高层的ROI特征，继续对上一层损失区域检测的mask做上采样，然后与ROI特征拼接组合，并使用单个1
×
1卷积层预测更精细的信息损失结点，以保持检测模块的轻量化。5.根据权利要求1所述的基于信息损失区域检测机制的舌图像分割方法，其特征在于，所述的步骤3中，基于Transformer的舌图像分割方法包含三个模块：结点编码器、序列编码器和像素解码器；结点编码器选取四叉树的三个层级信息损失点作为输入，首先丰富每个信息损失结点的特征表示，四叉树结点经结点编码器编码之后，为了建立点与点之间的关联，序列编码器中的多头注意力模块会对输入序列进行点之间的特征融合及更新，序列编
码器的每一层都由多头自注意力模块和全连接的前馈网络组成，可以执行序列上的全局跨尺度预测，最后，再由像素解码器对序列编码器编码之后的结点进行解码，预测每个点是否属于舌体。6.根据权利要求1所述的基于信息损失区域检测机制的舌图像分割方法，其特征在于，具体包括以下步骤：步骤1：收集舌图像数据集数据集从以下三个渠道获得：（1）通过舌诊采集仪器采集到的100张舌像；（2）在GitHub上下载的开源舌像100张；（3）通过手机摄像头采集到的舌像50张；步骤2：舌图像标注与预处理使用Labelme图像标注工具对步骤1收集到的250张舌像进行舌体轮廓标注，保存标注文件并批量生成数据集；然后，利用数据增强程序对标注后的舌图像随机进行旋转、平移、缩放、添加噪声等一系列预处理操作，将原始250张带标签的舌图像扩展到3000张；步骤3:构建舌图像分割模型首先对输入舌图像进行主干特征提取，获得共享特征层，接着特征金字塔网络对共享特征层进行上采样、组合提取有效的特征层，在此获得的有效特征层用来构造ROI特征金字塔，进行信息损失区域的检测和舌图像的由粗到细的分割，包括从主干特征提取、特征金字塔的构建、信息损失区域检测和舌图像的分割四个方面；3.1 主干特征提取使用ResNet101作为主干特征提取，ResNet101主要包含：Conv Block和Identity Block两个块，其中Conv Block残差边有卷积，输入和输出的维度是不一样的，它的作用是改变网络的维度；Identity Block输入维度和输出维度相同，可以串联，用于加深网络的；输入舌图像尺寸为（1024,1024,3），经过ResNet101两个块的处理，舌图像的维度发生改变并串联，长和宽不断的进行压缩，获得多个共享特征层，可以加深网络深度，提高舌体检测效果；用C2表示舌图像在主干特征提取中长和宽压缩了2次的共享特征层，尺寸为（256,256,256）；C3表示长和宽压缩了3次的共享特征层，尺寸为...

【专利技术属性】
技术研发人员：牛秋月，曹莉，任靖娟，赵春霞，李瑞昌，王晓鹏，
申请(专利权)人：河南中医药大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人