一种口腔CT影像的数据增强方法技术

技术编号:33129542 阅读:10 留言:0更新日期:2022-04-17 00:44
本发明专利技术涉及医学图像处理技术领域,更具体地,涉及一种口腔CT影像的数据增强方法;包括:S1.基于生成对抗网络对数据进行增强:向生成对抗网络中输入原始口腔CT影像数据,通过生成对抗网络对原始口腔CT影像数据进行训练,得到一个口腔CT影像数据生成模型;S2.采用生成对抗网络空间的可解释控制发现算法获取特征控制向量:使用生成对抗网络空间算法对步骤S1得到的口腔CT影像数据生成模型潜空间在欧氏空间下进行主成分分析,无监督地识别潜在特征控制向量,并对潜在特征控制向量进行人工筛选保存;S3.采用特征控制向量定向生成口腔CT影像。本发明专利技术能够在原始数据量较少的情况下生成高分辨率的口腔CT影像,以辅助口腔CT影像实现大数据智能分析。数据智能分析。数据智能分析。

【技术实现步骤摘要】
一种口腔CT影像的数据增强方法


[0001]本专利技术涉及医学图像处理
,更具体地,涉及一种口腔CT影像的数据增强方法。

技术介绍

[0002]完成口腔CT影像的大数据智能分析,需要收集大量的口腔CT影像,经过专业人员对数据进行标注,构建口腔CT影像数据集,基于这个数据集进行后续的智能分析。数据集的采集和标注费时费力,更重要的是,由于不同疾病的发病率不一样,常见疾病的样本数量与罕见疾病的差距很大,导致数据集出现类别不平衡的问题。
[0003]现有技术中,一些处理方法是依靠待分类图像与各类别原型图像间欧氏距离来判断待分类图像的类别,但是该方法不适用于口腔CT影像数据,因为口腔CT影像数据集不同类别影像之间的差异在很多情况下仅在较小的一块区域体现,依照该方法获得的各个类别的原型图像之间差异不大;一些处理方法是将生成对抗网络WGAN应用于甲状腺超声数据ROI区域数据集中,实现了对良性与恶性甲状腺超声数据ROI区域数据集的扩充,并在增强后的数据集和原始数据集上对比了VGG

16网络的性能,证明了该数据增强方法的可行性,但是无法定向生成原始数据集指定类别的图像数据,因为它缺乏控制图像生成类别的模块,由生成对抗网络随机生成的图像需要额外的人工分类标注,才可实现数据增强,医学图像的标注需由如医生的专业人员来完成,在类别数较多的时候需要耗费大量的时间,并且该方法所需要的原始数据量较多,且要求原始训练集各类别样本分布较为均匀,当原始数据量较少,原始数据集存在着严重类别不平衡的情况时,该方法不一定能够胜任,同时该方法无法生成如512*512 的较高分辨率的高质量图像,在对医学图像数据质量要求较高、数据集细节较为丰富的医学图像分类任务中表现不佳。

技术实现思路

[0004]本专利技术为克服上述现有技术中的缺陷,提供一种口腔CT影像的数据增强方法,能够在原始数据量较少的情况下生成高分辨率的口腔CT影像,以辅助口腔CT影像实现大数据智能分析。
[0005]为解决上述技术问题,本专利技术采用的技术方案是:一种口腔CT影像的数据增强方法,包括以下步骤:
[0006]S1.基于生成对抗网络对数据进行增强:向生成对抗网络中输入原始口腔 CT影像数据,通过生成对抗网络对原始口腔CT影像数据进行训练,得到一个口腔CT影像数据生成模型;
[0007]S2.采用生成对抗网络空间的可解释控制发现算法获取特征控制向量:使用生成对抗网络空间算法对步骤S1得到的口腔CT影像数据生成模型潜空间在欧氏空间下进行主成分分析,无监督地识别潜在特征控制向量,并对潜在特征控制向量进行人工筛选保存;
[0008]S3.采用特征控制向量定向生成口腔CT影像。
[0009]进一步的,所述的生成对抗网络包括第一生成器、第二生成器、判别器和映射网络;所述的第一生成器,将原始口腔CT影像分割成N
×
N个单元,并设计一个目标函数,对口腔CT影像上的ROI区域的矩形标注进行训练,得到口腔CT影像上颌窦ROI区域目标识别模型,用于输出口腔CT影像上颌窦ROI 区域坐标;所述的第二生成器与映射网络相互配合,映射网络对潜空间进行解耦,由隐藏变量z生成中间隐藏变量w,将变量w转换而来的仿射变换和随机噪声加入到第二生成器的每一层中,达到对生成图像各个尺度特征进行控制的目的,实现可控制的图像生成;所述的判别器接受来自第一生成器的坐标信息以及来自第二生成器所生成的假图像信息的输入,对第二生成器生成的图像真假进行判断。
[0010]进一步的,所述的步骤S1具体包括:
[0011]S11.向生成对抗网络中输入原始口腔CT影像,原始口腔CT影像中一部分带有对上颌窦ROI区域的矩形标注,另一部分没有;通过第一生成器的处理后,未经标注的口腔CT影像得到一个以上颌窦ROI区域为中心的、尺寸相同的矩形标注;
[0012]S12.映射网络将隐藏变量z经过归一化处理后,通过多层全连接层,得到中间隐藏变量w,并配合随机噪声,作为第二生成器的初始及各个卷积层的输入,输入过程采用AdaIN算法,生成可控制的图像;
[0013]S13.第一生成器和第二生成器的输出共同作为判别器的输入,判别输入的图片是真实的还是虚假的。
[0014]其中,AdaIN是一个现成的算法,自适应实例归一化是对它的直译,它是一种风格迁移的算法,输入一个样式图和一个内容图,即可以将样式图的一些特征迁移到内容图上。IN是机器学习中的术语,即实例归一化,作用是对单个图片的所有像素求均值和标准差。Ada是adaptive的缩写,自适应,顾名思义就是自适应地进行IN的调整。
[0015]进一步的,所述的第一生成器的目标函数为:
[0016][0017]第一生成器的输出为一个1
×
5的向量,即预测的式中,当网格中存在目标时p
ij
为1,q
ij
为0,网格中不存在目标时p
ij
为0,q
ij
为1;x
i
与y
i
为真实边界框坐标,与为预测边界框坐标;w
i
与h
i
为真实边界框的宽与高,与为预测边界框的宽与高;c
i
为置信度值,为预测边界框与真实边界框的交叉值,即预测边界框与真实边界框交集的面积除以并集的面积。
[0018]进一步的,所述的第二生成器与判别器均采用WGAN

GP目标函数,表示如下:
[0019][0020]式中,λ为常数,指数学期望,指梯度,D为概率函数,判断输入的参数为真的概率,结果在[0,1]区间;指梯度的L2范数;x为真实数据,为生成器所生成的
数据,指真实数据的分布,指由隐式定义的模型分布;设x
r
与x
g
为分别从与中随机采样的一对真假样本,引入一个值为[0,1] 的随机数∈,则的随机数∈,则指在x
r
与x
g
间线性随机插值采样,则为该采样流程得到的所满足的分布。
[0021]进一步的,所述的步骤S3具体包括:将真实或生成的口腔CT影像投影至第二生成器的潜空间,潜空间是压缩数据的表示,其中相似的数据点在空间上更靠近,在特征控制向量上加以设定的权重参数进行移动,生成所需类型的高分辨率口腔CT影像数据。
[0022]本专利技术还提供一种口腔CT影像的数据增强系统,包括:
[0023]获取模块:用于向生成对抗网络中输入原始口腔CT影像数据,通过生成对抗网络对原始口腔CT影像数据进行训练,得到一个口腔CT影像数据生成模型;
[0024]处理模块:用于使用生成对抗网络空间算法对步骤S1得到的口腔CT影像数据生成模型潜空间在欧氏空间下进行主成分分析,无监督地识别潜在特征控制向量,并对潜在特征控制向量进行人工筛选保存;
[0025]生成模块:用于采用特征控制向量定向生成口腔CT影像。
[0026]进一步的,所述的获本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种口腔CT影像的数据增强方法,其特征在于,包括以下步骤:S1.基于生成对抗网络对数据进行增强:向生成对抗网络中输入原始口腔CT影像数据,通过生成对抗网络对原始口腔CT影像数据进行训练,得到一个口腔CT影像数据生成模型;S2.采用生成对抗网络空间的可解释控制发现算法获取特征控制向量:使用生成对抗网络空间算法对步骤S1得到的口腔CT影像数据生成模型潜空间在欧氏空间下进行主成分分析,无监督地识别潜在特征控制向量,并对潜在特征控制向量进行人工筛选保存;S3.采用特征控制向量定向生成口腔CT影像。2.根据权利要求1所述的口腔CT影像的数据增强方法,其特征在于,所述的生成对抗网络包括第一生成器、第二生成器、判别器和映射网络;所述的第一生成器,将原始口腔CT影像分割成N
×
N个单元,并设计一个目标函数,对口腔CT影像上的ROI区域的矩形标注进行训练,得到口腔CT影像上颌窦ROI区域目标识别模型,用于输出口腔CT影像上颌窦ROI区域坐标;所述的第二生成器与映射网络相互配合,映射网络对潜空间进行解耦,由隐藏变量z生成中间隐藏变量w,将变量w转换而来的仿射变换和随机噪声加入到第二生成器的每一层中,达到对生成图像各个尺度特征进行控制的目的,实现可控制的图像生成;所述的判别器接受来自第一生成器的坐标信息以及来自第二生成器所生成的假图像信息的输入,对第二生成器生成的图像真假进行判断。3.根据权利要求2所述的口腔CT影像的数据增强方法,其特征在于,所述的步骤S1具体包括:S11.向生成对抗网络中输入原始口腔CT影像,原始口腔CT影像中一部分带有对上颌窦ROI区域的矩形标注,另一部分没有;通过第一生成器的处理后,未经标注的口腔CT影像得到一个以上颌窦ROI区域为中心的、尺寸相同的矩形标注;S12.映射网络将隐藏变量z经过归一化处理后,通过多层全连接层,得到中间隐藏变量w,并配合随机噪声,作为第二生成器的初始及各个卷积层的输入,输入过程采用AdaIN算法,生成可控制的图像;S13.第一生成器和第二生成器的输出共同作为判别器的输入,判别输入的图片是真实的还是虚假的。4.根据权利要求3所述的口腔CT影像的数据增强方法,其特征在于,所述的第一生成器的目标函数为:第一生成器的输出为一个1
×
5的向量,即预测的式中,当网格中存在目标时p
ij
为1,q
ij
为0,网格中不存在目标时p
ij
为0,q
ij
为1;x
i
与y
i
为真实边界框坐标,与为预测边界框坐标;w
i
与h
i
为真实边界框的宽与高,与为预测边界框的宽与高;c
i
为置信度值,为预测边界框与真实边界框的交叉值,即预测边界框与真实边界框交集的面积除
以并集的面积。5.根据权利要求4所述的口腔CT影像的数据增强方法,其特征在于,所述的第二生成器与判别器均采用WGAN

GP目标函数,表示如下:式中,λ为常数,指数学期望,指梯度,D为概率函数,判断输入的参数为真的概率,结果在[0,1]区间;指梯度的L2范数;x为真实数据,为生成器所生成的数据,指真实数据的分布,指由隐式定义的模型分布;设x
r
与x
g
为分别从与中随机采样的一对真假样本,引入一个值为[0,1]的随机数∈,则样的一对真假样本,引入一个值为[0,1]的随机数∈,则指在x<...

【专利技术属性】
技术研发人员:黄凯李浩鹏陈泽涛宋日辉曾培生刘海雯
申请(专利权)人:中山大学附属口腔医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1