一种基于类难度与标签分布感知边际的分类模型训练方法技术

技术编号:42005010 阅读:23 留言:0更新日期:2024-07-12 12:26
本发明专利技术公开了一种基于类难度与标签分布感知边际的分类模型训练方法,获取皮肤病变目标数据集,对目标数据集进行预处理;从目标数据集中随机抽取样本,组成验证子集,确定要训练的深度神经网络模型;将目标数据集去除验证子集之后的部分作为训练集,用来训练深度神经网络模型;根据分类难度计算综合难度系数DIF,并确定综合难度边际损失函数;将综合难度边际损失函数用于深度神经网络模型训练的反向传播过程中,对目标训练集中不同类别数据样本进行损失计算,直至网络收敛,达到网络训练的目的。上述方法能有效应对现有皮肤病变图像数据集存在的数量不均衡以及分类难度不均衡的问题,显著提高深度学习神经网络模型的分类精度。

【技术实现步骤摘要】

本专利技术涉及人工智能和深度学习,尤其涉及一种基于类难度与标签分布感知边际的分类模型训练方法


技术介绍

1、目前,人工智能和深度学习技术的迅猛发展在医学图像处理方面得到显著的成果,利用神经网络模型可以实现对医学影像的自动诊断,为医生和患者提供更加便捷高效的皮肤疾病诊断和筛查服务,同时提高诊断准确性和效率。表现良好的神经网络模型往往依赖于大规模、高质量的数据集,但是在皮肤癌图像领域,面临着数据集稀缺、类别不均衡以及图像质量参差不齐等问题,由于收集皮肤癌图像的成本较高,且涉及隐私等敏感问题,可用于训练的数据集规模相对较小,这给神经网络模型的训练带来了挑战。同时由于皮肤病变的不同类型在实际病例中出现的频率不均衡,导致数据集中各类别样本数量差异较大,这也会影响神经网络模型的泛化能力。全球最大的皮肤病变公开数据集之一isic2019,一共包含八类皮肤病类型:黑色素瘤(mel)、黑素细胞痣(nv)、基底细胞癌(bcc)、光化性角化病(akiec)、良性角化病(bkl)、皮肤纤维瘤(df)、血管瘤(vasc)、鳞状细胞癌(scc)共25331张图片数据。其中,黑素细胞本文档来自技高网...

【技术保护点】

1.一种基于类难度与标签分布感知边际的分类模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述基于类难度与标签分布感知边际的分类模型训练方法,其特征在于,在步骤1中,对目标数据集进行预处理的过程是将原始数据集进行数据增强,包括随机裁剪、随机翻转,变换至256*256大小,确保保留中心病灶区域;

3.根据权利要求1所述基于类难度与标签分布感知边际的分类模型训练方法,其特征在于,在步骤2中,在验证子集中,每一个类的样本数量保持相同,设为n;

4.根据权利要求1所述基于类难度与标签分布感知边际的分类模型训练方法,其特征在于,在步骤3中,分类难度D...

【技术特征摘要】

1.一种基于类难度与标签分布感知边际的分类模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述基于类难度与标签分布感知边际的分类模型训练方法,其特征在于,在步骤1中,对目标数据集进行预处理的过程是将原始数据集进行数据增强,包括随机裁剪、随机翻转,变换至256*256大小,确保保留中心病灶区域;

3.根据权利要求1所述基于类难度与标签分布感知边际的分类模型训练方法,其特征在于,在步骤2中,在验证子集中,每一个类的样本数量保持相同,设为n;

4.根据权利要求1所述基于类难度与标签分布感知边际的分类模型训练方法,...

【专利技术属性】
技术研发人员:陈明销姚鹏徐亮申书伟邵鹏飞徐晓嵘
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1