分割模型训练方法、图像标注方法及相关装置制造方法及图纸

技术编号:24857371 阅读:49 留言:0更新日期:2020-07-10 19:09
本发明专利技术公开了人工智能领域的一种分割模型训练方法,包括:获取第一样本集S和第二样本集R,其中,第一样本集S包括多张第一图像及多张第一图像中每张第一图像的目标标签,第二样本集R包括多张第二图像;根据第一样本集S中的多张第一图像及其目标标签和第二样本集R中的多张第二图像对初始分割模型进行ASTO训练,以得到目标分割模型,初始分割模型是根据第一样本集S对原始模型进行训练得到的。采用本发明专利技术实施例训练得到的分割模型可克服对于图像可用标注数量较少,标注成本昂贵的问题。

【技术实现步骤摘要】
分割模型训练方法、图像标注方法及相关装置
本专利技术涉及人工智能领域,尤其涉及一种分割模型训练方法、图像标注方法及相关装置。
技术介绍
人工智能(artificialintelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能领域的研究包括机器人,自然语言处理,计算机视觉,决策与推理,人机交互,推荐与搜索,AI基础理论等。图像分析是计算机视觉中的重要任务之一,它可以提供很多相关的信息从而辅助医生进行病情诊疗。对图像中的目标进行分割是实现医疗影像内容分析的基础,通过分割技术可以直接地找到器官区域、判断是否存在病灶、病灶的大小和位置等。在手术导航、病情分析判断等方面具有广泛的应用。深度学习使得图像分割技术的准确率实现了显著的提升,但是在图像的一些处理场景中效果却不是那么理想。深度神经网络的学习很大程度上依赖于庞大的标注数据,这就使得神经网络在图像上的学习效果不如在自然图像上的学习效果。图像相比自然图像获取难度更大,从数据的采集到数据的公开都存在许多困难,在数量上也远不如自然图像。图像另一个区别于自然图像的是数据维度。图像大部分是通过空间采样得到的,它不仅包含一个切面的2D图像信息,还包含空间中每个体素位置的信息。因此,常采用2D和3D两类神经网络来处理这些数据,而其中3D网络可用的数据量比2D网络更少。更重要的是对自然图像进行标注不需要太高的专业水平,但是图像的标注却需要专业的医疗人员进行标注,不同医疗人员的标注细致程度同样存在差异,而且分割样本集的标注工作量也远高于分类检测等任务。随着医疗水平的提升,每天都会产生很多图像数据,但是这些数据往往都是没有标注信息的原始数据。如何充分利用这些大量的没有标注信息的图像,减少网络对于数据标注的过分依赖,对于进一步提高图像分析能力十分重要。
技术实现思路
本专利技术实施例提供一种分割模型训练方法、图像标注方法及相关装置,采用本专利技术实施例得到的分割模型有利于克服对于图像可用标注数量较少,标注成本昂贵的问题。第一方面,本专利技术实施例提供一种分割模型训练方法,包括:获取第一样本集S和第二样本集R,其中,第一样本集S包括多张第一图像及多张第一图像中每张第一图像的目标标签,第二样本集R包括多张第二图像;根据第一样本集S中的多张第一图像及其目标标签和第二样本集R中的多张第二图像对初始分割模型进行异构老师-学生优化(Asynchronousteacher-studentoptimization,ASTO)训练,以得到目标分割模型,初始分割模型是根据所述第一样本集S对原始模型进行训练得到的。通过基于ASTO训练得到的分割模型,使用该分割模型对图像进行标注,克服了图像可用标注数量较少,标注成本昂贵的问题,并且提高了对图像进行标注的效率和准确性。在一个可行的实施例中,根据第一样本集S中的多张第一图像及其目标标签和第二样本集S中的多张第二图像对初始分割模型进行ASTO训练,以得到目标分割模型,包括:根据第一样本集S中的第一图像及其目标标签对原始模型进行训练,以得到初始分割模型;将第二样本集R中的每张第二图像输入到初始分割模型中进行预测,以得到每张第二图像的初始伪标签,根据第一样本集S中每张第一图像及其目标标签和第二样本集R中每张第二图像及其初始伪标签获取第二样本集R中每张第二图像的目标标签;根据第一样本集S中每张第一图像及其目标标签和第二样本集R中每张第二图像及其目标标签对原始模型或初始分割模型进行训练,以得到目标分割模型。在一个可行的实施例中,根据所述第一样本集S中每张第一图像及其目标标签和第二样本集R中每张第二图像及其初始伪标签获取第二样本集R中每张第二图像的目标标签,包括:将第二样本集R中第二图像及初始伪标签划分为第三样本集R1和第四样本集R2,第三样本集R1和第四样本集R2中均包括多张第二图像及其初始伪标签;基于第一样本集S,第三样本集R1中的第二图像及其初始伪标签对初始分割模型进行训练得到第一分割模型;基于第一样本集S,第四样本集R2中的第二图像及其初始伪标签对初始分割模型进行训练得到第二分割模型;根据第一样本集S中每张第一图像及其目标标签,第三样本集R1及其基于第二分割模型预测出的每张第二图像的参考伪标签,第四样本集R2及其基于第一分割模型预测出的每张第二图像的参考伪标签获取第二样本集R中每张第二图像的目标标签。在一个可行的实施例中,根据所述第一样本集S中每张第一图像及其目标标签和第二样本集R中每张第二图像及其初始伪标签获取所述第二样本集R中每张第二图像的目标标签,包括:S1、根据第一样本集S中每张第一图像及其目标标签和第三样本集R1中每张第二图像及其伪标签L’i-1对所述初始分割模型进行训练,以得到分割模型Mi,根据分割模型Mi对第四样本集R2中的每张图像进行预测,以得到第四样本集R2中每张图像的伪标签Li;S2、根据第一样本集S中每张第一图像及其目标标签和第四样本集R2中每张第二图像及其伪标签Li-1对初始分割模型进行训练,以得到分割模型M’i,根据分割模型M’i对第三样本集R1中的每张图像进行预测,以得到第三样本集合R1中每张图像的伪标签L’i;S3、当i不小于N时,将第四样本集R2中每张图像的伪标签Li确定为该图像的目标标签,将第三样本集R1中每张图像的伪标签L’i确定为该图像的目标标签;当i小于N时,令i=i+1,并重复执行S1-S3;其中,当i=1时,第三样本集R1中每张第二图像的伪标签L’i-1为该图像的初始伪标签,第四样本集R2中每张第二图像的伪标签Li-1为该图像的初始伪标签。在一个可行的实施例中,第三样本集R1和第四样本集R2没有交集。可选地,第三样本集R1和第四样本集R2没有交集,且第三样本集R1和第四样本集R2中图像及其标签的数量相同。可选地,第三样本集R1和第四样本集R2由第二样本集R均分得到。第二方面,本专利技术实施例提供一种图像标注方法,包括:获取待标注图像,将待标注图像输入到目标分割模型进行预测,以得到所述待标注图像对应的目标标签,所述目标分割模型是根据第一样本集S中的多张第一图像及其目标标签和第二样本集R中的多张第二图像对初始分割模型进行ASTO训练得到的。通过基于ASTO训练得到的分割模型对图像进行标注,以克服图像可用标注数量较少,标注成本昂贵的问题,并且提高了对图像进行标注的效率和准确性。在一个可行的实施例中,初始分割模型是根据第一样本集S中的多张第一图像及其目标标签对原始模型进行训练得到的。进一步地,原始模型基于卷积神经网络得到的。在一个可行的实施例中,目本文档来自技高网
...

【技术保护点】
1.一种分割模型训练方法,其特征在于,包括:/n获取第一样本集S和第二样本集R,其中,所述第一样本集S包括多张第一图像及所述多张第一图像中每张第一图像的目标标签,所述第二样本集R包括多张第二图像;/n根据所述第一样本集S中的多张第一图像及其目标标签和第二样本集R中的多张第二图像对初始分割模型进行异构老师-学生优化ASTO训练,以得到目标分割模型,所述初始分割模型是根据所述第一样本集S对原始模型进行训练得到的。/n

【技术特征摘要】
1.一种分割模型训练方法,其特征在于,包括:
获取第一样本集S和第二样本集R,其中,所述第一样本集S包括多张第一图像及所述多张第一图像中每张第一图像的目标标签,所述第二样本集R包括多张第二图像;
根据所述第一样本集S中的多张第一图像及其目标标签和第二样本集R中的多张第二图像对初始分割模型进行异构老师-学生优化ASTO训练,以得到目标分割模型,所述初始分割模型是根据所述第一样本集S对原始模型进行训练得到的。


2.根据权利要求1所述的方法,其特征在于,所述根据所述第一样本集S中的多张第一图像及其目标标签和第二样本集S中的多张第二图像对初始分割模型进行异构老师-学生优化ASTO训练,以得到目标分割模型,包括:
根据第一样本集S中的第一图像及其目标标签对原始模型进行训练,以得到所述初始分割模型;
将所述第二样本集R中的每张第二图像输入到所述初始分割模型中进行预测,以得到所述每张第二图像的初始伪标签,
根据所述第一样本集S中每张第一图像及其目标标签和第二样本集R中每张第二图像及其初始伪标签获取所述第二样本集R中每张第二图像的目标标签;
根据所述第一样本集S中每张第一图像及其目标标签和第二样本集R中每张第二图像及其目标标签对所述原始模型或所述初始分割模型进行训练,以得到所述目标分割模型。


3.根据权利要求2所述的方法,其特征在于,所述根据所述第一样本集S中每张第一图像及其目标标签和第二样本集R中每张第二图像及其初始伪标签获取所述第二样本集R中每张第二图像的目标标签,包括:
将所述第二样本集R中第二图像及初始伪标签划分为第三样本集R1和第四样本集R2,所述第三样本集R1和第四样本集R2中均包括多张第二图像及其初始伪标签;
基于所述第一样本集S,所述第三样本集R1中的第二图像及其初始伪标签对所述初始分割模型进行训练得到第一分割模型;
基于所述第一样本集S,所述第四样本集R2中的第二图像及其初始伪标签对所述初始分割模型进行训练得到第二分割模型;
根据所述第一样本集S中每张第一图像及其目标标签,所述第三样本集R1及其基于所述第二分割模型预测出的每张第二图像的参考伪标签,所述第四样本集R2及其基于所述第一分割模型预测出的每张第二图像的参考伪标签获取所述第二样本集R中每张第二图像的目标标签。


4.根据权利要求3所述的方法,其特征在于,所述根据所述第一样本集S中每张第一图像及其目标标签和第二样本集R中每张第二图像及其初始伪标签获取所述第二样本集R中每张第二图像的目标标签,包括:
S1、根据所述第一样本集S中每张第一图像及其目标标签和所述第三样本集R1中每张第二图像及其伪标签L’i-1对所述初始分割模型进行训练,以得到分割模型Mi,根据所述分割模型Mi对所述第四样本集R2中的每张图像进行预测,以得到所述第四样本集R2中每张图像的伪标签Li;
S2、根据所述第一样本集S中每张第一图像及其目标标签和所述第四样本集R2中每张第二图像及其伪标签Li-1对所述初始分割模型进行训练,以得到分割模型M’i,根据所述分割模型M’i对所述第三样本集R1中的每张图像进行预测,以得到所述第三样本集合R1中每张图像的伪标签L’i;
S3、当i不小于N时,将所述第四样本集R2中每张图像的伪标签Li确定为该图像的目标标签,将所述第三样本集R1中每张图像的伪标签L’i确定为该图像的目标标签;当i小于N时,令i=i+1,并重复执行S1-S3;
其中,当i=1时,所述第三样本集R1中每张第二图像的伪标签L’i-1为该图像的初始伪标签,所述第四样本集R2中每张第二图像的伪标签Li-1为该图像的初始伪标签。


5.根据权利要求3或4的方法,其特征在于,所述第三样本集R1和第四样本集R2没有交集。


6.一种图像标注方法,其特征在于,包括:
获取待标注图像,
将所述待标注图像输入到目标分割模型进行预测,以得到所述待标注图像对应的目标标签,所述目标分割模型是根据第一样本集S和第二样本集R对初始分割模型进行异构老师-学生优化ASTO训练得到的;
所述第一样本集S包括多张第一图像及所述多张第一图像中每张第一图像的目标标签,所述第二样本集R包括多张第二图像;
所述初始分割模型是根据所述第一样本集S对原始模型进行训练得到的。


7.根据权利要求6所述的方法,其特征在于,所述目标分割模型根据所述第一样本集S中的多张第一图像的目标标签和第二样本集R中的多张第二图像及其目标标签对所述初始分割模型或者所述原始模型进行训练得到的,
所述第二样本集R中每张第二图像的目标标签是根据所述第一样本集S中第一图像及其目标标签和所述第二样本集S中的第二图像及其参考伪标签得到的。


8.根据权利要求7所述的方法,其特征在于,所述第二样本集S中的第二图像的参考伪标签是将第三样本集R1中的图像输入到第二分割模型中预测的和将第四样本集R2中的图像输入到第一分割模型中进行预测的,
所述第一分割模型是基于所述第一样本集S,所述第三样本集R1中的第二图像及其初始伪标签对所述初始分割模型进行训练得到的;所述第二分割模型是基于所述第一样本集S,所述第四样本集R2中的第二图像及其初始伪标签对所述初始分割模型进行训练得到的;
所述第三样本集R1和所述第四样本集R2是对所述第二样本集R进行划分得到的。


9.根据权利要求8所述的方法,其特征在于,所述第三样本集R1中的第二图像的初始伪标签是将该第二图像输入到所述初始分割模型中进行预测得到的;
所述第四样本集R2中的第二图像的初始伪标签是将该第二图像输入到所述初始分割模型中进行预测得到的。


10.一种分割网络训练装置,其特征在于,包括:
存储器,用于存储指令;以及
至少一台处理器,与所述存储器耦合;
其中,当所述至少一台处理器执行所述指令时,执行如下步骤:
获取第一样本集S和第二样本集R,其中,所述第一样本集S包括多张第一图像及所述多张第一图像中每张第一图像的目标标签,...

【专利技术属性】
技术研发人员:何建忠霍馨月谢凌曦杨子杰田奇
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1