【技术实现步骤摘要】
本专利技术涉及数据预处理方法,特别涉及一种跨模态聚类引导和对比学习的图像编码器的训练方法。
技术介绍
1、在自然图像领域,大规模标注数据集的使用显著推动了深度学习的发展,在视觉识别方面取得了显著成就。然而,在医学影像中,获得高质量的手动标注数据集是一个相当大的挑战,因为这需要经验丰富的医生进行注释,既耗时又昂贵。因此,深度学习在医学影像领域的进展受到了一定的限制。针对自然图像领域中标签数据集不足的问题,通常采用预训练方法,即模型首先在大规模自然图像数据集上进行预训练,然后将学到的一般图像表示迁移到下游任务,从而提升下游模型的收敛速度和泛化性能。但是,由于自然图像和医学图像之间的域差异,直接将在如imagenet这样的自然图像数据集上预训练的模型转移到下游医学影像任务时,往往产生次优结果。为了解决这个问题,一个主流的方法是利用自监督方法对大规模未标注医学图像数据集进行预训练。然而,这种方法仍然面临两个主要挑战:第一,可用于预训练的医学图像数据量远少于自然图像数据;第二,医学图像更强调图像内部的局部特征和细粒度信息,而不仅仅是全局信息。
...【技术保护点】
1.一种跨模态聚类引导图像编码器的训练方法,其特征在于:包括如下步骤:
2.如权利要求1所述的一种跨模态聚类引导图像编码器的训练方法,其特征在于:所述S2中获得局部图像特征和全局图像特征的步骤为:
3.如权利要求2所述的一种跨模态聚类引导图像编码器的训练方法,其特征在于:所述S2中获得局部文本特征和全局文本特征的步骤为:
4.如权利要求3所述的一种跨模态聚类引导图像编码器的训练方法,其特征在于:所述S3中计算的过程为:
5.如权利要求4所述的一种跨模态聚类引导图像编码器的训练方法,其特征在于:所述S3中计算的过程为:
...【技术特征摘要】
1.一种跨模态聚类引导图像编码器的训练方法,其特征在于:包括如下步骤:
2.如权利要求1所述的一种跨模态聚类引导图像编码器的训练方法,其特征在于:所述s2中获得局部图像特征和全局图像特征的步骤为:
3.如权利要求2所述的一种跨模态聚类引导图像编码器的训练方法,其特征在于:所述s2中获得局部文本特征和全局文本特征的步骤为:
4.如权利要求3所述的一种跨模态聚类引导图像编码器的训练方法,其特征在于:所述s3中计算的过程为:
5.如权利要求4所述的一种跨模态聚类引导图像编码器的训练方法,其特征在于:所述s3中计算的过程为:
6.如...
【专利技术属性】
技术研发人员:兰利彬,李洪兴,卢玲,朱凌云,夏遵辉,李颜心,
申请(专利权)人:重庆理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。