一种小样本场景下基于自适应边际损失的制造技术

技术编号:39774140 阅读:7 留言:0更新日期:2023-12-22 02:22
本发明专利技术公开了一种小样本场景下基于自适应边际损失的早产儿视网膜病

【技术实现步骤摘要】
一种小样本场景下基于自适应边际损失的ROP分期诊断方法


[0001]本专利技术属于计算机视觉与医疗辅助
,更为具体地讲,该专利技术涉及一种小样本场景下基于自适应边际损失的早产儿视网膜病
(ROP)
分期诊断方法


技术介绍

[0002]近年来,人工智能技术和各种学科进行交叉结合取得了令人惊讶的成绩,推动了各行各业的发展

特别是在医疗领域,有效的人工智能技术辅助医护人员做出更好的判断和决策,为疾病的识别和研究带来创新,有效提高了医学诊断等各类医学任务的效率

[0003]早产儿视网膜病
(ROP)
是一种视网膜血管疾病,指在孕
36
周以下

低出生体重

长时间吸氧的早产儿,其未血管化的视网膜发生纤维血管瘤增生

收缩,并进一步引起牵拉性视网膜脱离和失明

为降低新生儿的失明风险,迫切需要对这部分新生人口进行筛查;然而,各地区专门从事
ROP
的眼科医生很少,对
ROP
进行诊断也需要耗费大量的时间和精力

为提高
ROP
诊断的效率和准确性,尽早治疗
ROP
以使得对新生儿的视力损害最小化,目前针对
ROP
是否患病这一二分类任务出现了一些利用深度学习辅助诊断的方法,但
ROP
疾病不仅需要对是否患病进行诊断,而且在患病后需要明确病人处于哪个患病阶段,以进行针对性的治疗

[0004]一般
ROP
的诊断结果会分为正常和以下五个患病阶段,分别是:
[0005]①
ROP 1
期:分界线,视网膜血管去和无血管区之间存在分界线
[0006]②
ROP 2
期:嵴,比1期白线更厚的凸起

[0007]③
ROP 3
期:视网膜外新生血管形成

[0008]④
ROP 4
期:部分视网膜脱离

[0009]⑤
ROP 5
期:完全视网膜脱离

[0010]但到目前为止,并没有很好的方法能够对已患
ROP
的婴儿进行分期诊断的自动化
AI
工具,如果使用经典多分类卷积神经网络去完成这项任务是几乎不可能的,因为相邻两期之间的患病特征差异非常小,相当难以分辨,这就会导致
AI
模型出现很高的误报率,这在医学领域是不能忍受的

[0011]另外更加无法忽视的一点是,对
ROP
的分期诊断也是一个很典型的小样本场景,因为训练一个分类网络模型还需要大量高质量的有标签数据,而在一个区域内,
ROP
患者的数量是有限的,其中能分辨出患病特征的眼底图像就更少,而且越往
ROP
后期
(
比如四期,五期
)
的患者,数量就越少,所以必须要考虑数据量少和类别不平衡的情况,再加上我们需要对患者进行分期诊断,那势必还需要详细的患病阶段性标签,而这种高质量的阶段性标签,需要医学专家花费大量的精力和预算,这就导致经典的图像分类方法很难奏效

[0012]在训练样本很少的情况下,无监督学习是一种较为有效的的获取先验知识的方法,它指:当我们缺乏足够的先验知识,难以进行人工标注类别或进行人工类别标注的成本太高时,我们希望计算机能代我们完成这些工作,或至少提供一些帮助

根据类别未知
(
没有被标记
)
的训练样本解决模式识别中的各种问题,称之为无监督学习

[0013]自监督学习
(self

supervised learning)
是无监督学习的一种,模型直接从无标签数据中自行学习,无需人工标注数据,其目的是希望模型能够学习到一种通用的特征表达用于下游任务
(Downstream Tasks)。
比如,可以让计算机对大量无标签图像进行旋转
(
比如
[0
°
,90
°
,180
°
,270
°
])
,同时记录下旋转的角度作为伪标签,通过让模型预测旋转的角度来进行先验知识的学习

可以这样解释,要想让网络知道图像到底旋转了多少度的前提就是网络已经可以理解图像中的物体位置,类型和形状等概念了

如果网络不能够理解这些概念的话,它就无法区分出来图像到底旋转了多少度

可以看到,从学习伪标签的确定到模型学习先验知识,从头至尾都没有人工参与,通过这种方式,就解决了图像数量少,标签获取的代价太大的难题

[0014]虽然自监督学习是在小样本场景下提升模型泛化能力的一种有效的解决方法,但是其核心目的是为了下游任务服务,即
ROP
分期诊断

但传统分类方式很难得到令人满意的结果,这是因为
ROP
相邻两期之间的患病特征差异很小,就会导致神经网络对图像的识别发生混乱,再加上本身受数据量少的限制,会加剧这种情况的发生

因此核心问题就在于如何进一步提升神经网络的分类能力,让神经网络学习到那些不易发现的细微特征,大大提高模型的分类性能,从而完成对于
ROP
分期诊断的任务

[0015]自适应边际损失
(Adaptive Margin Loss)
,在本专利技术中特指在分类时利用某些额外信息
(
比如语义信息
)
来对损失函数进行约束,使相似的类别经过神经网络的映射可以分得更开,即强迫神经网络在训练时去学习那些相似类间的细微差异,进一步提升网络的特征提取能力和分类能力,从而完成
ROP
的分期诊断任务


技术实现思路

[0016]本专利技术的目的在于解决小样本场景下
ROP
的自动化分期诊断难题

需克服患病数据量小

类间数据不平衡,以及相邻两期数据差异小导致模型无法正确分类等问题

因此我们从小样本学习的角度出发,结合自适应边际损失,提出了一种小样本场景下基于自适应边际损失的
ROP
分期诊断方法,可以有效完成早产儿视网膜病的分期诊断

[0017]为实现上述专利技术目的,本专利技术在小样本场景下基于无监督学习,以及自适应边际损失来进行早产儿视网膜病的分期诊断,其特征在于在有限的数据量下,先将眼底图像分为两部分,一部分是大量无标签的眼底图像
(
如正常人的眼底图像,不需要数据标注
)本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于度量的自适应边际距离早产儿视网膜病
(ROP)
分期诊断方法,其特征在于在有限的数据量下,先将眼底图像分为两部分,一部分是大量无标签的眼底图像
(
如正常人的眼底图像,不需要数据标注
)
,另一部分是带有专家分期标签的眼底图像

首先利用自监督学习,将大量无标签图像随机旋转一定角度,通过预测图像的旋转角度作为上游任务来训练一个初步的特征提取器,同时也防止模型在小样本分类场景下过拟合,然后再利用这个预训练好的特征提取器对有标签的数据进行进一步的训练,使之能够判别不同期的数据

具体做法是在训练的过程中,对损失函数进行正则约束,基于专家经验对交叉熵损失函数中的
softmax
操作加上自适应边际距离,从而强迫模型学习那些细微的类间差异,从而提高模型的判别精度,具体包括以下步骤:
(1)
数据收集从医院采集正常眼底图像
、ROP 1

、ROP 2

、ROP 3

、ROP 4
期以及
ROP 5
期共六类眼底图像,每一期的数据量需尽可能多,其中正常眼底图像可认为是无限的,而每期患病的眼底图像每类至少
100
人,每个人平均采集
20
张左右的图像,要求每期有患病特征的眼底图像的数量尽可能均衡
。(2)
图像标注对来自正常人的眼底图像标签默认赋值为0,对于来自不同期
ROP
患者的眼底图像,需要由医学专家为图像赋予标签,对患者眼底图像中没有表现出
ROP
患病特征的图像,直接忽略不计,而表现出患病特征的图像需要由专家赋予图像所在患病期的标签
(
即1,2,3,4,5这五种标签
)
,相同类别存放至同一标签文件夹下
。(3)
数据预处理原始数据存在拍摄环境
(
如光照

杂物等
)
的影响,或者是拍摄人员的操作失误,导致采集的数据集中存在很多噪声数据,需要将这部分图像进行清洗删除

同时由于原始图像尺寸不一致,且图像较大,冗余特征过多,不便于计算机读写以及运算,故统一将原始图像尺寸
resize

224
×
224.(4)
数据增强因现实原因导致图像数据量较少,且存在部分类别不平衡的情况,所以需要对数据进行扩充和增强

主要采用如下几种方式:

色彩调节由于
ROP
眼底图像受拍摄环境,以及婴儿眼底色素等因素的影响,这会导致不同图像存在不同程度的亮度差异以及色彩不均匀,所以采用均匀分布来调整图像的色彩分布


图像旋转由于网络的训练需要尽可能多的数据,结合拍摄时眼底成像本身就存在不同的角度的图像,所以对图像进行随机轻微旋转来初步扩充数据集

另外由于人的眼睛分为左右眼,所以很自然地可以使用镜像翻转来作为扩充图像数据的依据

另外两种图像增强的方式也可以组合,来扩充更多的数据


图像标准化为了提高模型的收敛速度以及尽可能减少奇异数据对模型带来的不良影响,使用
Z

Score
标准化方法对图像的
R、G、B
三个通道的像素值分别进行标准化处理,即:
其中
X
scale
是归一化后的新的图像数据,
x
是原始图像,
μ
是所有样本均值,
σ
是样本标准差
。(5)
划分数据集根据图像是否有标签将处理好的数据分为两部分,一部分用作模型泛化能力的训练,另一部分用作模型分类能力的训练,两部分数据均需要分别划分训练集和测试集
。(6)
上游...

【专利技术属性】
技术研发人员:邵俊明王朴真杨勤丽
申请(专利权)人:电子科技大学长三角研究院湖州
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1