【技术实现步骤摘要】
一种基于半监督学习的医学图像自动标注方法
本专利技术涉及图像的半监督自动标注,具体的说涉及如何利用少量有标记的图像和附加的文字描述信息,对医学图像进行自动标注的半监督学习方法。
技术介绍
在上个世纪末这个世纪初,随着计算机技术和成像技术的发展,医学影像成为临床诊断的重要信息来源,在众多疾病的诊断上,如脑梗死、肺结节、肺栓塞、甲状腺肿瘤等,起到了至关重要的作用。医学图像是医生诊断的重要参考依据,利用图像标注技术可以辅助医生对患者进行初步的诊断,并提供相应的治疗方案供医生参考,从而减轻医生的一部分工作负荷,促进医疗实现智慧转型.目前,全国各大医院已经搜集了大量的影像数据,如:B超扫描图像,彩色多普勒超声图像,核磁共振图像,CT图像,PET图像,SPECT图像,数字X光机图像,X射线透视图像,电子内窥图像等数据。如何有效的管理这些图片,如何帮助医生迅速的找到感兴趣的图像,利用这些己有病例图帮助其进行诊断并提高工作效率,这些问题使得医学图像的检索及其相关技术成为一个研究热点。通常,图像检索技术分为两类:基于文本的图像检索技术((Text-basedImageRetrieval,TBIR)和基于内容的图像检索技术(Content-basedImageRetrieval,CBIR)。在TBIR技术中,图像通常先由人工标注,然后再以检索文本的方式来检索图像,但TBIR技术存在着明显的缺陷,特别是在图像的种类和数量非常多时,手工标注图像所需的工作量非常大。CBIR技术是基于图像的低层特征进行图像的检索,然而用户在检索图像时并 ...
【技术保护点】
1.一种基于半监督学习的医学图像自动标注方法,其特征在于,包括以下步骤:/n步骤(1)、以在ImageNet预训练的Resnet为一级分类网络,并将第四和第五个卷积块的卷积替换成空洞率为2的空洞卷积;搜集医学图像数据,并由专业的医生进行标记,获得数据集,并划分成训练集和测试集;然后,通过有分类标签的训练集对一级分类网络进行训练,完成一级分类网络的训练;将训练集输入到一级分类网络中得到数据的一级通用深度卷积特征;/n步骤(2)、利用训练好的一级分类网络对数据进行预分类,得到预分类的混淆矩阵,然后通过谱聚类的方式得到类别训练子集,将其输入到二级分类网络中进行训练,该网络与一级分类网络结构相同;得到数据的二级特殊深度卷积特征;将一级通用深度卷积特征和二级特殊深度卷积特征通过拼接的方式融合在一起,得到数据的深度卷积特征;/n步骤(3)、将图像的附加信息通过word2vec编码成多源异构特征;/n步骤(4)、将深度卷积特征与多源异构特征进行特征融合,并通过SVM分类器得到最后的标注结果;/n步骤(5)、训练过程中,输入训练集,计算输出的损失函数,并通过反向传播算法调整网络参数;在测试阶段,输入测 ...
【技术特征摘要】
1.一种基于半监督学习的医学图像自动标注方法,其特征在于,包括以下步骤:
步骤(1)、以在ImageNet预训练的Resnet为一级分类网络,并将第四和第五个卷积块的卷积替换成空洞率为2的空洞卷积;搜集医学图像数据,并由专业的医生进行标记,获得数据集,并划分成训练集和测试集;然后,通过有分类标签的训练集对一级分类网络进行训练,完成一级分类网络的训练;将训练集输入到一级分类网络中得到数据的一级通用深度卷积特征;
步骤(2)、利用训练好的一级分类网络对数据进行预分类,得到预分类的混淆矩阵,然后通过谱聚类的方式得到类别训练子集,将其输入到二级分类网络中进行训练,该网络与一级分类网络结构相同;得到数据的二级特殊深度卷积特征;将一级通用深度卷积特征和二级特殊深度卷积特征通过拼接的方式融合在一起,得到数据的深度卷积特征;
步骤(3)、将图像的附加信息通过word2vec编码成多源异构特征;
步骤(4)、将深度卷积特征与多源异构特征进行特征融合,并通过SVM分类器得到最后的标注结果;
步骤(5)、训练过程中,输入训练集,计算输出的损失函数,并通过反向传播算法调整网络参数;在测试阶段,输入测试集,即可得到标注结果。
2.根据权利要求1所述的一种基于半监督学习的医学图像自动标注方法,其特征在于,步骤(1)具体方法如下:
以在ImageNet上预训练的Resnet为一级分类网络,并将第四和第五个卷积块的卷积替换成空洞率为2的空洞卷积;搜集医学图像数据,并由专业的医生进行标记,获得数据集并划分成训练集和测试集;然后,将有分类标签的训练集输入到一级分类网络中对网络进行微调,完成一级分类网络的训练;训练完成后,将训练集的图像数据输入到训练好的一级分类网络中得到图像数据的一级通用深度卷积特征。
3.根据权利要求2所述的一种基于半监督学习的医学图像自动标注方法,其特征在于,步骤(2)具体方法如下:
利用训练好的一级分类网络对数据进行预分类,得到预分类的混淆矩阵,然后通过谱聚类的方式得到相似度高的样本作为类别训练子集;利用全连接法来构建邻接矩阵,将每个样本数据看作一个节点,距离远的两个样本点之间的权重低,而距离近的...
【专利技术属性】
技术研发人员:颜成钢,张二四,彭开来,朱晨瑞,孙垚棋,张继勇,李宗鹏,张勇东,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。