模型训练、图像分割方法和装置制造方法及图纸

技术编号:36343694 阅读:51 留言:0更新日期:2023-01-14 17:57
本申请公开了模型训练方法和装置,涉及图像处理技术领域。该方法的一具体实施方式包括:获取训练样本集,通过以下方式对预设神经网络进行改进,得到目标神经网络:在预设神经网络编码器中,相邻的至少两个子模块中的每两个相邻子模块间,设置注意力图生成模块;基于第一损失函数,确定目标损失函数;基于目标损失函数、带标签样本图像集,对目标神经网络进行训练,得到分割模型。该实施方式有效提升了训练得到的分割模型的分割精度。训练得到的分割模型的分割精度。训练得到的分割模型的分割精度。

【技术实现步骤摘要】
模型训练、图像分割方法和装置


[0001]本申请涉及医疗健康
,具体涉及图像处理
,尤其涉及一种模型训练、图像分割方法和装置。

技术介绍

[0002]利用人工智能技术的高效性和数据容量大的特点,快速标准化学习儿童肺部疾病中不同的病症并加以处理,可以在较小的平均训练周期内训练鲁棒性和泛化性强的儿童肺炎检测模型,不受时空约束复制部署,减少人工成本和专职阅片医生的培养成本,弥补医生的空缺,提高儿童肺部疾病检测医院的诊疗效率,具有广阔的应用前景。
[0003]目前,常用算法主要有图像分割算法、知识蒸馏等。图像分割算法是对图像中的均匀权重的像素点阵进行无差别意义上的像素级别分割,会导致算法对全局的缺陷更加重视,而对于真正需要关注的难点区域,却会在损失函数的作用下放弃搜索,导致模型表现不佳。知识蒸馏方法更多的注重知识从大体量模型到小体量模型之间知识的迁移,而忽略了输入数据本身上下文信息的重要性,没有对类别之间的联系进行建模,像素被分错的风险较高。

技术实现思路

[0004]本申请实施例提供了一种模型训练方法、装置、设备以及存储介质。
[0005]根据第一方面,本申请实施例提供了一种模型训练方法,该方法包括:获取训练样本集,通过以下方式对预设神经网络进行改进,得到目标神经网络:在预设神经网络编码器中,相邻的至少两个子模块中的每两个相邻子模块间,设置注意力图生成模块;基于第一损失函数,确定目标损失函数;基于目标损失函数、带标签样本图像集,对目标神经网络进行训练,得到分割模型。
[0006]根据第二方面,本申请实施例提供了一种图像分割方法,该方法包括:获取待分割图像;将待分割图像输入分割模型,得到待分割图像的语义分割结果,其中,分割模型是如上述第一方面任一实现方式描述的方法得到的分割模型。
[0007]根据第三方面,本申请实施例提供了一种模型训练装置,该装置包括:获取模块,被配置成获取训练样本集,改进模块,被配置成通过以下方式对预设神经网络进行改进,得到目标神经网络:在预设神经网络编码器中,相邻的至少两个子模块中的每两个相邻子模块间,设置注意力图生成模块;确定模块,被配置成基于第一损失函数,确定目标损失函数;训练模块,被配置成基于目标损失函数、带标签样本图像集,对目标神经网络进行训练,得到分割模型。
[0008]根据第四方面,本申请实施例提供了一种图像分割装置,该装置包括:获得模块,被配置成获取待分割图像;分割模块,被配置成将待分割图像输入分割模型,得到待分割图像的语义分割结果,其中,分割模型是如上述第一方面任一实现方式描述的方法得到的分割模型。
[0009]根据第五方面,本申请实施例提供了一种电子设备,该电子设备包括一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被该一个或多个处理器执行,使得一个或多个处理器实现如第一方面或第二方面中任一实现方式描述的方法。
[0010]根据第六方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面或第二方面中任一实现方式描述的方法。
[0011]本申请通过获取训练样本集,通过以下方式对预设神经网络进行改进,得到目标神经网络:在预设神经网络编码器中,相邻的至少两个子模块中的每两个相邻子模块间,设置注意力图生成模块;基于第一损失函数,确定目标损失函数;基于目标损失函数、带标签样本图像集,对目标神经网络进行训练,得到分割模型,提升了训练得到的分割模型的分割精度。
[0012]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其他特征将通过以下的说明书而变得容易理解。
附图说明
[0013]图1是本申请可以应用于其中的示例性系统架构图;
[0014]图2a是根据本申请的模型训练方法的一个实施例的流程图;
[0015]图2b是根据本申请的模型训练方法的一个实施例的示意图;
[0016]图2c是根据本申请的模型训练方法的又一个实施例的示意图;
[0017]图2d是根据本申请的模型训练方法的另一个实施例的示意图;
[0018]图3是根据本申请的模型训练方法的一个应用场景的示意图;
[0019]图4是根据本申请的图像分割方法的又一个实施例的流程图;
[0020]图5是根据本申请的模型训练装置的一个实施例的示意图;
[0021]图6是根据本申请的图像分割装置的一个实施例的示意图;
[0022]图7是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。
具体实施方式
[0023]以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0024]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0025]图1示出了可以应用本申请的模型训练方法的实施例的示例性系统架构100。
[0026]如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0027]终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如,图像分割类应用、通讯类应用等。
[0028]终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏的各种电子设备,包括但不限于手机和笔记本电脑。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供模型训练的服务),也可以实现成单个软件或软件模块。在此不做具体限定。
[0029]服务器105可以是提供各种服务的服务器,例如,获取训练样本集,通过以下方式对预设神经网络进行改进,得到目标神经网络:在预设神经网络编码器中,相邻的至少两个子模块中的每两个相邻子模块间,设置注意力图生成模块;基于第一损失函数,确定目标损失函数;基于目标损失函数、带标签样本图像集,对目标神经网络进行训练,得到分割模型。
[0030]需要说明的是,服务器105可以是硬件,也可以是软件。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成多个软件或软件模块(例如用来提供训练模型的服务),也可以实现成单个软件或软件模块本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,所述方法包括:获取训练样本集,所述训练样本集包括带标签样本图像集,其中,标签用于指示样本图像各像素点的类别信息;通过以下方式对预设神经网络进行改进,得到目标神经网络:在预设神经网络编码器中,相邻的至少两个子模块中的每两个相邻子模块间,设置注意力图生成模块,所述注意力图生成模块用于根据所对应的两个子模块中低层级的子模块输出的特征图生成注意力图,并将所述注意力图输入所述两个子模块中高层级的子模块,以对高层级子模块的注意力图的生成进行监督,所述子模块包括卷积层;基于第一损失函数,确定目标损失函数,其中,所述第一损失函数基于目标神经网络针对样本图像的输出结果和样本图像的标签构建;基于所述目标损失函数、所述带标签样本图像集,对所述目标神经网络进行训练,得到分割模型。2.根据权利要求1所述的方法,其中,所述基于第一损失函数,确定目标损失函数,包括:基于第一损失函数和第二损失函数,确定目标损失函数,其中,所述第二损失函数基于所述注意力图生成模块输出的注意力图,及所述注意力图生成模块所对应的两个子模块中高层级的子模块输出的注意力图确定。3.根据权利要求2所述的方法,其中,所述第一损失函数包括交叉熵损失函数和交并比损失函数,以及所述基于第一损失函数和第二损失函数,确定目标损失函数,包括:基于交叉熵损失函数、交并比损失函数和第二损失函数,确定目标损失函数。4.根据权利要求1所述的方法,其中,所述在预设神经网络编码器中,相邻的至少两个子模块中的每两个相邻子模块间,设置注意力图生成模块,包括:在编码器中的至少三个子模块中的每两个相邻子模块间,设置注意力图生成模块。5.根据权利要求1所述的方法,其中,所述训练样本集还包括:无标签样本图像集,以及所述方法还包括:将无标签样本图像输入所述分割模型,得到无标签样本图像对应的伪标签样本图像集;合并所述伪标签样本图像集和所述带标签样本图像集,对分割模型进行再次训练,得到新的分割模型。6.根据权利要求1

5任一项所述的方法,其中,所述预设神经网络为端到端训练的神经网络U

Net。7.一种图像分割方法,所述方法包括:获取待分割图像;将所述待分割图像输入分割模型,得到待分割图像的语义分割结果,其中,所述分割模型是如权利要求1

6之一所述的方法得到的分割模型。8.一种模型训练装置,包括:获取模块,被配置成获取训练样本集,所述训练样本集包括带标签样本图像集,其中,标签用于指示样本图像各像素点的类别信息;改进模块,被配置成通过以下方式对预设神经网络进行改进,得到目标神经网络:在预
设神经网络编码器...

【专利技术属性】
技术研发人员:付奎李超安山王虎
申请(专利权)人:北京京东拓先科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1