一种基于通道分离网络的自归一化图像分割方法技术

技术编号:41375009 阅读:28 留言:0更新日期:2024-05-20 10:19
本发明专利技术提出一种基于通道分离网络的自归一化图像分割方法。本发明专利技术所述方法改进了UNet分割算法,使用三维卷积神经网络CSN和二维卷积解码器搭建UNet结构,其中二维卷积解码器中使用SiLU激活函数,并利用其自归一化性质代替BN层,形成了一种基于三维卷积神经网络的二维分割算法,是对于特殊输入输出要求设计的图像分割算法,同时做到了计算复杂度和精度的权衡。同时引入多种现代模型的训练技术,将其组成为一种规范化训练框架去优化本发明专利技术提出的算法。

【技术实现步骤摘要】

本专利技术属于深度学习下的计算机视觉,特别是涉及一种基于通道分离网络的自归一化图像分割方法。尤其是针对3维x光扫描图像的2维语义分割方法。


技术介绍

1、出土的各类书籍、卷轴类文物表面记载了诸多关于古代哲学、科学、文学、数学、诗歌和政治的秘密,因此阅读这些文物表面字迹有着巨大的文化和经济价值。本专利技术使用的纸莎草卷轴数据集最早可追溯到公元79年,维苏威斯火山喷发摧毁了古罗马的诸多小镇。在考古学家对遗迹的发掘过程中,发现小镇中有一个包含大量纸莎草卷轴的海边别墅。虽然这些卷轴由于火山爆发的热量而碳化,但它们也因为被埋在地底被意外地保存下来。为准确还原这类文物中记载的信息,需要一种高效可靠的系统帮助研究人员重现文物表面字迹。

2、在过去的几年里,人们发现基于深度学习的方法在历史文档图像分析中发挥关键作用,被认为是满足分析具有显著退化水平和不同噪声类型的文档图像需求的一致选择。最近,基于深度学习的方法在文档图像分析的不同子领域和任务方面取得了显著进展,尤其在文本分割方面。oliveriade及其研究团队开发了一基于卷积神经网络(cnn)的框架,专注于本文档来自技高网...

【技术保护点】

1.一种基于通道分离网络的自归一化图像分割方法,其特征在于,所述方法具体为:

2.根据权利要求1所述的方法,其特征在于,所述S1对输入图片进行预处理,具体包括:水平翻转、垂直翻转、随机对比度调整、添加高斯噪声、高斯模糊、运动模糊、网格扭曲和CutOut。

3.根据权利要求1所述的方法,其特征在于,所述S2中输入的预处理图片进行批处理,具体包括样本维度的像素归一化处理、Mixup、CutMix以及通道堆叠。

4.根据权利要求3所述的方法,其特征在于,所述样本维度的像素归一化处理具体为:针对三维输入数据像素的均值方差去缩放其像素值,使得输入三维体的像素均值...

【技术特征摘要】

1.一种基于通道分离网络的自归一化图像分割方法,其特征在于,所述方法具体为:

2.根据权利要求1所述的方法,其特征在于,所述s1对输入图片进行预处理,具体包括:水平翻转、垂直翻转、随机对比度调整、添加高斯噪声、高斯模糊、运动模糊、网格扭曲和cutout。

3.根据权利要求1所述的方法,其特征在于,所述s2中输入的预处理图片进行批处理,具体包括样本维度的像素归一化处理、mixup、cutmix以及通道堆叠。

4.根据权利要求3所述的方法,其特征在于,所述样本维度的像素归一化处理具体为:针对三维输入数据像素的均值方差去缩放其像素值,使得输入三维体的像素均值为0方差为1,同时利用gpu并行实现针对每个样本均值和方差的计算。

5.根据权利要求3所述的方法,其特征在于,所述通道堆叠具体为:对于一个三维体输入,其具有维度(d,h,w),其中d为深度,h和w分别表示图像的高和宽;通道堆叠步骤需要先将输入的三维体在深度维度切割成重叠的三份,每份深度起始切割点相差x,切割厚度为t,随后将切割好的三维体在新的维...

【专利技术属性】
技术研发人员:金晶吴由欣姜宇
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1