【技术实现步骤摘要】
一种小样本场景下基于自适应边际损失的ROP分期诊断方法
[0001]本专利技术属于计算机视觉与医疗辅助
,更为具体地讲,该专利技术涉及一种小样本场景下基于自适应边际损失的早产儿视网膜病
(ROP)
分期诊断方法
。
技术介绍
[0002]近年来,人工智能技术和各种学科进行交叉结合取得了令人惊讶的成绩,推动了各行各业的发展
。
特别是在医疗领域,有效的人工智能技术辅助医护人员做出更好的判断和决策,为疾病的识别和研究带来创新,有效提高了医学诊断等各类医学任务的效率
。
[0003]早产儿视网膜病
(ROP)
是一种视网膜血管疾病,指在孕
36
周以下
、
低出生体重
、
长时间吸氧的早产儿,其未血管化的视网膜发生纤维血管瘤增生
、
收缩,并进一步引起牵拉性视网膜脱离和失明
。
为降低新生儿的失明风险,迫切需要对这部分新生人口进行筛查;然而,各地区专门从事
ROP
的眼科医生很少,对
ROP
进行诊断也需要耗费大量的时间和精力
。
为提高
ROP
诊断的效率和准确性,尽早治疗
ROP
以使得对新生儿的视力损害最小化,目前针对
ROP
是否患病这一二分类任务出现了一些利用深度学习辅助诊断的方法,但
ROP
疾病不仅需要对是否患病进行诊断,而且在患病后需要明确病 ...
【技术保护点】
【技术特征摘要】
1.
一种基于度量的自适应边际距离早产儿视网膜病
(ROP)
分期诊断方法,其特征在于在有限的数据量下,先将眼底图像分为两部分,一部分是大量无标签的眼底图像
(
如正常人的眼底图像,不需要数据标注
)
,另一部分是带有专家分期标签的眼底图像
。
首先利用自监督学习,将大量无标签图像随机旋转一定角度,通过预测图像的旋转角度作为上游任务来训练一个初步的特征提取器,同时也防止模型在小样本分类场景下过拟合,然后再利用这个预训练好的特征提取器对有标签的数据进行进一步的训练,使之能够判别不同期的数据
。
具体做法是在训练的过程中,对损失函数进行正则约束,基于专家经验对交叉熵损失函数中的
softmax
操作加上自适应边际距离,从而强迫模型学习那些细微的类间差异,从而提高模型的判别精度,具体包括以下步骤:
(1)
数据收集从医院采集正常眼底图像
、ROP 1
期
、ROP 2
期
、ROP 3
期
、ROP 4
期以及
ROP 5
期共六类眼底图像,每一期的数据量需尽可能多,其中正常眼底图像可认为是无限的,而每期患病的眼底图像每类至少
100
人,每个人平均采集
20
张左右的图像,要求每期有患病特征的眼底图像的数量尽可能均衡
。(2)
图像标注对来自正常人的眼底图像标签默认赋值为0,对于来自不同期
ROP
患者的眼底图像,需要由医学专家为图像赋予标签,对患者眼底图像中没有表现出
ROP
患病特征的图像,直接忽略不计,而表现出患病特征的图像需要由专家赋予图像所在患病期的标签
(
即1,2,3,4,5这五种标签
)
,相同类别存放至同一标签文件夹下
。(3)
数据预处理原始数据存在拍摄环境
(
如光照
、
杂物等
)
的影响,或者是拍摄人员的操作失误,导致采集的数据集中存在很多噪声数据,需要将这部分图像进行清洗删除
。
同时由于原始图像尺寸不一致,且图像较大,冗余特征过多,不便于计算机读写以及运算,故统一将原始图像尺寸
resize
为
224
×
224.(4)
数据增强因现实原因导致图像数据量较少,且存在部分类别不平衡的情况,所以需要对数据进行扩充和增强
。
主要采用如下几种方式:
①
色彩调节由于
ROP
眼底图像受拍摄环境,以及婴儿眼底色素等因素的影响,这会导致不同图像存在不同程度的亮度差异以及色彩不均匀,所以采用均匀分布来调整图像的色彩分布
。
②
图像旋转由于网络的训练需要尽可能多的数据,结合拍摄时眼底成像本身就存在不同的角度的图像,所以对图像进行随机轻微旋转来初步扩充数据集
。
另外由于人的眼睛分为左右眼,所以很自然地可以使用镜像翻转来作为扩充图像数据的依据
。
另外两种图像增强的方式也可以组合,来扩充更多的数据
。
③
图像标准化为了提高模型的收敛速度以及尽可能减少奇异数据对模型带来的不良影响,使用
Z
‑
Score
标准化方法对图像的
R、G、B
三个通道的像素值分别进行标准化处理,即:
其中
X
scale
是归一化后的新的图像数据,
x
是原始图像,
μ
是所有样本均值,
σ
是样本标准差
。(5)
划分数据集根据图像是否有标签将处理好的数据分为两部分,一部分用作模型泛化能力的训练,另一部分用作模型分类能力的训练,两部分数据均需要分别划分训练集和测试集
。(6)
上游...
【专利技术属性】
技术研发人员:邵俊明,王朴真,杨勤丽,
申请(专利权)人:电子科技大学长三角研究院湖州,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。