一种口腔CT影像的数据增强方法技术

技术编号：33129542 阅读：10 留言：0更新日期：2022-04-17 00:44

本发明专利技术涉及医学图像处理技术领域，更具体地，涉及一种口腔CT影像的数据增强方法；包括：S1.基于生成对抗网络对数据进行增强：向生成对抗网络中输入原始口腔CT影像数据，通过生成对抗网络对原始口腔CT影像数据进行训练，得到一个口腔CT影像数据生成模型；S2.采用生成对抗网络空间的可解释控制发现算法获取特征控制向量：使用生成对抗网络空间算法对步骤S1得到的口腔CT影像数据生成模型潜空间在欧氏空间下进行主成分分析，无监督地识别潜在特征控制向量，并对潜在特征控制向量进行人工筛选保存；S3.采用特征控制向量定向生成口腔CT影像。本发明专利技术能够在原始数据量较少的情况下生成高分辨率的口腔CT影像，以辅助口腔CT影像实现大数据智能分析。数据智能分析。数据智能分析。

全部详细技术资料下载

【技术实现步骤摘要】
一种口腔CT影像的数据增强方法

[0001]本专利技术涉及医学图像处理
，更具体地，涉及一种口腔CT影像的数据增强方法。

技术介绍

[0002]完成口腔CT影像的大数据智能分析，需要收集大量的口腔CT影像，经过专业人员对数据进行标注，构建口腔CT影像数据集，基于这个数据集进行后续的智能分析。数据集的采集和标注费时费力，更重要的是，由于不同疾病的发病率不一样，常见疾病的样本数量与罕见疾病的差距很大，导致数据集出现类别不平衡的问题。
[0003]现有技术中，一些处理方法是依靠待分类图像与各类别原型图像间欧氏距离来判断待分类图像的类别，但是该方法不适用于口腔CT影像数据，因为口腔CT影像数据集不同类别影像之间的差异在很多情况下仅在较小的一块区域体现，依照该方法获得的各个类别的原型图像之间差异不大；一些处理方法是将生成对抗网络WGAN应用于甲状腺超声数据ROI区域数据集中，实现了对良性与恶性甲状腺超声数据ROI区域数据集的扩充，并在增强后的数据集和原始数据集上对比了VGG
‑
16网络的性能，证明了该数据增强方法的可行性，但是无法定向生成原始数据集指定类别的图像数据，因为它缺乏控制图像生成类别的模块，由生成对抗网络随机生成的图像需要额外的人工分类标注，才可实现数据增强，医学图像的标注需由如医生的专业人员来完成，在类别数较多的时候需要耗费大量的时间，并且该方法所需要的原始数据量较多，且要求原始训练集各类别样本分布较为均匀，当原始数据量较少，原始数据集存在着严重类别不平衡的情况时，该方法不一定能够胜...

【技术保护点】

【技术特征摘要】
1.一种口腔CT影像的数据增强方法，其特征在于，包括以下步骤：S1.基于生成对抗网络对数据进行增强：向生成对抗网络中输入原始口腔CT影像数据，通过生成对抗网络对原始口腔CT影像数据进行训练，得到一个口腔CT影像数据生成模型；S2.采用生成对抗网络空间的可解释控制发现算法获取特征控制向量：使用生成对抗网络空间算法对步骤S1得到的口腔CT影像数据生成模型潜空间在欧氏空间下进行主成分分析，无监督地识别潜在特征控制向量，并对潜在特征控制向量进行人工筛选保存；S3.采用特征控制向量定向生成口腔CT影像。2.根据权利要求1所述的口腔CT影像的数据增强方法，其特征在于，所述的生成对抗网络包括第一生成器、第二生成器、判别器和映射网络；所述的第一生成器，将原始口腔CT影像分割成N
×
N个单元，并设计一个目标函数，对口腔CT影像上的ROI区域的矩形标注进行训练，得到口腔CT影像上颌窦ROI区域目标识别模型，用于输出口腔CT影像上颌窦ROI区域坐标；所述的第二生成器与映射网络相互配合，映射网络对潜空间进行解耦，由隐藏变量z生成中间隐藏变量w，将变量w转换而来的仿射变换和随机噪声加入到第二生成器的每一层中，达到对生成图像各个尺度特征进行控制的目的，实现可控制的图像生成；所述的判别器接受来自第一生成器的坐标信息以及来自第二生成器所生成的假图像信息的输入，对第二生成器生成的图像真假进行判断。3.根据权利要求2所述的口腔CT影像的数据增强方法，其特征在于，所述的步骤S1具体包括：S11.向生成对抗网络中输入原始口腔CT影像，原始口腔CT影像中一部分带有对上颌窦ROI区域的矩形标注，另一部分没有；通过第一生成器的处理后，未经标注的口腔CT影像得到一个以上颌窦ROI区域为中心的、尺寸相同的矩形标注；S12.映射网络将隐藏变量z经过归一化处理后，通过多层全连接层，得到中间隐藏变量w，并配合随机噪声，作为第二生成器的初始及各个卷积层的输入，输入过程采用AdaIN算法，生成可控制的图像；S13.第一生成器和第二生成器的输出共同作为判别器的输入，判别输入的图片是真实的还是虚假的。4.根据权利要求3所述的口腔CT影像的数据增强方法，其特征在于，所述的第一生成器的目标函数为：第一生成器的输出为一个1
×
5的向量，即预测的式中，当网格中存在目标时p
ij
为1，q
ij
为0，网格中不存在目标时p
ij
为0，q
ij
为1；x
i
与y
i
为真实边界框坐标，与为预测边界框坐标；w
i
与h
i
为真实边界框的宽与高，与为预测边界框的宽与高；c
i
为置信度值，为预测边界框与真实边界框的交叉值，即预测边界框与真实边界框交集的面积除
以并集的面积。5.根据权利要求4所述的口腔CT影像的数据增强方法，其特征在于，所述的第二生成器与判别器均采用WGAN
‑
GP目标函数，表示如下：式中，λ为常数，指数学期望，指梯度，D为概率函数，判断输入的参数为真的概率，结果在[0,1]区间；指梯度的L2范数；x为真实数据，为生成器所生成的数据，指真实数据的分布，指由隐式定义的模型分布；设x
r
与x
g
为分别从与中随机采样的一对真假样本，引入一个值为[0,1]的随机数∈，则样的一对真假样本，引入一个值为[0,1]的随机数∈，则指在x<...

【专利技术属性】
技术研发人员：黄凯，李浩鹏，陈泽涛，宋日辉，曾培生，刘海雯，
申请(专利权)人：中山大学附属口腔医院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人