一种构建基于卷积神经网络多任务二阶段结构的方法技术

技术编号:37666038 阅读:10 留言:0更新日期:2023-05-26 04:24
本发明专利技术涉及机器学习技术领域,具体涉及一种构建基于卷积神经网络多任务二阶段结构的方法,包括以下步骤:建立分割头,分割头的输入为U型卷积神经网络的输出分割图;建立检测头,检测头的输入为U型卷积神经网络右侧的多层特征图;分割头和检测头作为一阶段模型;建立分类头,分类头的输入为U型卷积神经网络最下一层特征图、分割头的输出及检测头的输出,分类头的输出作为最终的分割图,分类头作为二阶段模型;获取若干个样本图像,训练U型卷积神经网络、分割头、检测头及分类头,直到分类头的输出达到预设准确度,完成二阶段结构的构建。本发明专利技术的有益技术效果包括:能够方便的在数据相同或相似的多个子任务之间进行切换,提高项目实施效率。施效率。施效率。

【技术实现步骤摘要】
一种构建基于卷积神经网络多任务二阶段结构的方法


[0001]本专利技术涉及机器学习
,具体涉及一种构建基于卷积神经网络多任务二阶段结构的方法。

技术介绍

[0002]目前深度学习技术发展较快,其中U型结构的卷积神经网络模型有比较突出的特点。首先它是一个大写U的形状,包括左右两支,分别对应对图像的编码和解码功能。每一支都是一个多层结构,拥有对于图像特征的提取和组合的功能。同时两个支路之间有长距离的连接,从而保证了图像特征信息流在不同阶段上的充分保护和流通。通常认为,越位于深层的卷积网络,越是拥有处理高尺寸图像的能力,而对于细粒度较高的细节部分则显得不强。反之亦然。基于神经网络模型的图像识别技术在各个领域获得了深入而广泛的使用。
[0003]然而实际应用中发现,一些较大的项目通常有多个子任务组成。这些子任务之间常常在图像数据上具有高度相似性,却在图像分割识别上不同,无法很好的复用机器学习模型。比如脑部CT医疗数据的处理,子任务包括脑梗的检测、骨折的检测、出血的分割、肿瘤的分割等。这些子任务互不不同,但是都是在相同患者的脑部区域的图像数据上进行的。因此设计多个不同的模型分别处理这些子任务就显得非常累赘。各个子任务之间由于是单独的模型也没有互相通融信息的效果,增加了训练机器学习模型的负担。因此有必要研究一种能够方便进行迁移、复用的多任务机器学习模型,以实现在数据具有相似性的子任务之间进行复用的技术方案。

技术实现思路

[0004]本专利技术所要解决的技术问题:目前缺乏适宜在相同图像数据上执行多任务的机器学习模型的技术问题。提出了一种构建基于卷积神经网络多任务二阶段结构的方法,能够实现在数据具有相似性的子任务之间进行复用,提高整体项目的效率。
[0005]解决上述技术问题,本专利技术采用如下技术方案:一种构建基于卷积神经网络多任务二阶段结构的方法,所述卷积神经网络为U型卷积神经网络,包括左侧分支模型和右侧分支模型,左侧分支模型和右侧分支模型之间具有长连接,分别用于图像的编码和解码,包括以下步骤:建立分割头,所述分割头的输入为U型卷积神经网络的输出分割图;建立检测头,检测头的输入为U型卷积神经网络右侧的多层特征图;所述分割头和检测头作为一阶段模型;建立分类头,所述分类头的输入为U型卷积神经网络最下一层特征图、分割头的输出及检测头的输出,所述分类头的输出作为最终的分割图,所述分类头作为二阶段模型;获取若干个样本图像,将样本图像输入所述U型卷积神经网络,以所述分类头的输出计算损失函数,训练U型卷积神经网络、分割头、检测头及分类头的参数,直到所述分类头的输出达到预设准确度,完成多任务二阶段结构的构建。
[0006]作为优选,空置所述分割头,所述分类头直接与U型卷积神经网络的输出分割图连接,或者建立的分割头为无参数的连接。
[0007]作为优选,为所述检测头添加ASPP金字塔结构前置头,所述ASPP金字塔结构前置头连接在所述检测头和U型卷积神经网络右侧的多层特征图之间,所述ASPP金字塔结构前置头的输入为U型卷积神经网络右侧的多层特征图,所述ASPP金字塔结构前置头的输出作为所述检测头的输入。
[0008]作为优选,还包括后处理模块,所述后处理模块设置在所述分类头之前,U型卷积神经网络最下一层特征图、分割头的输出及检测头的输出连接后处理模块,所述后处理模块的输出为经裁剪出检测框内的图像,所述后处理模块的输出作为所述分类头的输入。
[0009]作为优选,所述分类头为ResNet18模型。
[0010]作为优选,训练U型卷积神经网络、分割头、检测头及分类头的参数时,在前若干个样本图像的训练中,停用所述U型卷积神经网络的长连接。
[0011]作为优选,训练U型卷积神经网络、分割头、检测头及分类头的参数时,首先使用若干个样本图像对所述U型卷积神经网络进行单独训练,而后再将分割头、检测头及分类头与所述U型卷积神经网络连接,再使用样本图像对U型卷积神经网络、分割头、检测头及分类头的参数机械能训练。
[0012]作为优选,获取样本图像的方法为:获取若干个图像,随机遮盖图像的部分区域,由所述分类头输出复原的图像,复原的图像与原图像的差异作为损失函数。
[0013]作为优选,复原的图像与原图像的差异为遮盖区域内复原的图像与原图像全部像素的差值的和。
[0014]作为优选,还包括迁移训练方法,用于在已被训练过的U型卷积神经网络及二阶段结构用于新的图像识别,所述迁移训练方法包括:重新获取若干个样本图像,随机遮盖样本图像的部分区域,由所述分类头输出复原的图像,复原的图像与原图像的差异作为损失函数;将所述U型卷积神经网络左侧编码器的参数固定,仅训练所述U型卷积神经网络左侧解码器、分割头、检测头及分类头的参数,直到所述分类头的输出达到预设准确度;结束训练或者开放所述U型卷积神经网络左侧编码器的参数的训练,继续训练直到所述分类头的输出达到预设准确度。
[0015]本专利技术的有益技术效果包括:本专利技术提供的二阶段结构能够灵活的进行模型叠加,支持预训练和迁移训练,能够方便的在数据相同或相似的多个子任务之间进行切换,有效降低模型训练的负担,提高项目实施效率。
[0016]本专利技术的其他特点和优点将会在下面的具体实施方式、附图中详细的揭露。
附图说明
[0017]下面结合附图对本专利技术做进一步的说明:图1为本专利技术实施例多任务二阶段结构示意图。
[0018]图2为本专利技术实施例构建多任务二阶段结构流程示意图。
[0019]图3为本专利技术实施例多任务二阶段结构迁移训练方法流程示意图。
[0020]其中:1、左侧分支模型,2、长连接,3、右侧分支模型,4、分割头,5、ASPP金字塔结构
前置头,6、检测头,7、后处理模块,8、分类头。
具体实施方式
[0021]下面结合本专利技术实施例的附图对本专利技术实施例的技术方案进行解释和说明,但下述实施例仅为本专利技术的优选实施例,并非全部。基于实施方式中的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得其他实施例,都属于本专利技术的保护范围。
[0022]在下文描述中,出现诸如术语“内”、“外”、“上”、“下”、“左”、“右”等指示方位或者位置关系仅是为了方便描述实施例和简化描述,而不是指示或暗示所指的装置或者元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。
[0023]一种构建基于卷积神经网络多任务二阶段结构的方法,请参阅附图1,本实施例使用的卷积神经网络为U型卷积神经网络,U型卷积神经网络包括左侧分支模型1和右侧分支模型3,左侧分支模型1和右侧分支模型3之间具有长连接2,分别用于图像的编码和解码。
[0024]请参阅附图2,构建基于卷积神经网络多任务二阶段结构的方法包括以下步骤:步骤A01)建立分割头4,分割头4的输入为U型卷积神经网络的输出分割图;步骤A02)建立检测头6,检测头6的输入为U型卷积神经网络右侧的多层特征图;步骤A03)分割头4和检测头6作本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种构建基于卷积神经网络多任务二阶段结构的方法,所述卷积神经网络为U型卷积神经网络,包括左侧分支模型和右侧分支模型,左侧分支模型和右侧分支模型之间具有长连接,分别用于图像的编码和解码,其特征在于,包括以下步骤:建立分割头,所述分割头的输入为U型卷积神经网络的输出分割图;建立检测头,检测头的输入为U型卷积神经网络右侧的多层特征图;所述分割头和检测头作为一阶段模型;建立分类头,所述分类头的输入为U型卷积神经网络最下一层特征图、分割头的输出及检测头的输出,所述分类头的输出作为最终的分割图,所述分类头作为二阶段模型;获取若干个样本图像,将样本图像输入所述U型卷积神经网络,以所述分类头的输出计算损失函数,训练U型卷积神经网络、分割头、检测头及分类头的参数,直到所述分类头的输出达到预设准确度,完成多任务二阶段结构的构建。2.根据权利要求1所述的一种构建基于卷积神经网络多任务二阶段结构的方法,其特征在于,空置所述分割头,所述分类头直接与U型卷积神经网络的输出分割图连接,或者建立的分割头为无参数的连接。3.根据权利要求1或2所述的一种构建基于卷积神经网络多任务二阶段结构的方法,其特征在于,为所述检测头添加ASPP金字塔结构前置头,所述ASPP金字塔结构前置头连接在所述检测头和U型卷积神经网络右侧的多层特征图之间,所述ASPP金字塔结构前置头的输入为U型卷积神经网络右侧的多层特征图,所述ASPP金字塔结构前置头的输出作为所述检测头的输入。4.根据权利要求1或2所述的一种构建基于卷积神经网络多任务二阶段结构的方法,其特征在于,还包括后处理模块,所述后处理模块设置在所述分类头之前,U型卷积神经网络最下一层特征图、分割头的输出及检测头的输出连接后处理模块,所述后处理模块的输出为经裁剪出检测框内的图像,所述后处理模块的输出作为所述分类头的输入。5.根据权利要求1或2所述的一种构建...

【专利技术属性】
技术研发人员:李德轩徐枫郭雨晨
申请(专利权)人:杭州涿溪脑与智能研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1