一种模型训练方法、装置及电子设备制造方法及图纸

技术编号:36532832 阅读:15 留言:0更新日期:2023-02-01 16:16
本公开揭示了一种模型训练方法、装置及电子设备,属于人工智能领域,可应用于图像处理、精密仪器领域,尤其可应用于眼科OCT等医疗设备领域。该方法包括:获取多个OCT医学图像以及对应的多个关于组织结构的标注图像;基于多个OCT医学图像以及对应的多个组织结构标注图像,划分出第一训练集和第一验证集;在图像宽度方向上对第一训练集和第一验证集中的图像进行采样,得到对应的第二训练集和第二验证集;基于第二训练集和第二验证集,对至少一个候选模型进行训练并确定出目标模型,以便用于对OCT医学图像进行图像分割。对OCT医学图像进行图像分割。对OCT医学图像进行图像分割。

【技术实现步骤摘要】
一种模型训练方法、装置及电子设备


[0001]本公开属于人工智能领域,可应用于图像处理、精密仪器领域,尤其可应用于眼科OCT等医疗设备领域。

技术介绍

[0002]人类眼底组织在光学相干断层扫描技术(Optical coherence tomography,简称OCT)图像上呈现层次分明的层状结构。大部分眼底病变与眼底层结构属性息息相关,例如,视网膜病变会改变视网膜层厚度、某些眼底病变只出现在特定层结构中等。对OCT眼底图像进行层结构分割是眼底图像分析的基础,对眼底层结构进行快速准确分割,有助于量化眼底结构属性,从而辅助医生和研究人员研究、诊断和治疗眼底病变。

技术实现思路

[0003]专利技术人经对现有技术研究分析发现,现有技术中,针对眼底图像结构的精细标注获取难度较大,导致用于眼底图像分割模型开发的样本数量较少,且采集眼底图像受图像采集设备型号、拍摄模式和扫描范围单一等因素影响,导致图像来源单一,使得对眼底OCT图像的分割模型的应用场景受限,难以在大规模多源图像数据下应用。
[0004]有鉴于此,本公开的目的在于提供一种模型训练方法、装置及电子设备,以解决上述技术问题。
[0005]第一方面,本公开提供了一种模型训练方法,包括:
[0006]获取多个OCT医学图像以及对应的多个关于组织结构的标注图像;
[0007]基于所述多个OCT医学图像以及对应的所述多个组织结构标注图像,划分出第一训练集和第一验证集;
[0008]在图像宽度方向上对所述第一训练集和所述第一验证集中的图像进行采样,得到对应的第二训练集和第二验证集;
[0009]基于所述第二训练集和所述第二验证集,对至少一个候选模型进行训练并确定出目标模型,以便用于对OCT医学图像进行图像分割。
[0010]可选的,在图像宽度方向上对所述第一训练集和所述第一验证集中的图像进行采样,包括:
[0011]在图像宽度方向上,以特定步长滑动满足特定窗口宽度的窗口,分别对所述第一训练集和所述第一验证集中的图像进行裁剪,
[0012]其中,所述特定步长小于所述特定窗口宽度。
[0013]可选的,所述方法还包括:
[0014]在图像高度方向上,对所述第一训练集和所述第一验证集中已完成图像宽度方向上的采样得到的图像进行填充,以使通过图像宽度方向上的采样得到的图像在图像高度方向上达到预定高度值,
[0015]其中,所述预定高度值为2的幂次。
[0016]可选的,所述OCT医学图像包括眼底OCT图像;
[0017]所述关于组织结构的标注图像是对对应眼底OCT图像中涉及眼后节特定组织结构和/或眼后节特定组织结构间进行图像分割和标注得到的,其中,所述眼后节特定组织结构包括以下组织结构中的一种或多种:玻璃体、神经纤维层、神经节细胞层、内丛状层、内核层、外丛状层、外核层、外界膜、肌样体带、椭圆体带、神经色素上皮层、脉络膜、巩膜、视盘。
[0018]可选的,所述多个OCT医学图像包括多个眼底OCT图像;
[0019]所述多个眼底OCT图像包括:对多个患者以多种拍摄模式进行眼部拍摄获得的涉及多个拍摄范围的眼底OCT图像。
[0020]可选的,对至少一个候选模型进行训练并确定出目标模型包括:
[0021]基于所述第二训练集对至少一个候选模型中的每个模型分别进行训练;
[0022]基于所述第二验证集,针对每个训练后的候选模型确定预测值与对应标注值之间的交并比;
[0023]基于确定的交并比,从至少一个训练后的候选模型中选定一个模型以作为所述目标模型。
[0024]可选的,所述方法还包括在训练过程中执行以下操作中的至少之一:
[0025]调整所述目标模型的卷积次数;
[0026]调整所述目标模型中卷积核的个数;
[0027]调整所述目标模型的下采样次数。
[0028]第二方面,本公开还提供了一种模型训练装置,包括:
[0029]获取模块,用于获取多个OCT医学图像以及对应的多个关于组织结构的标注图像;
[0030]划分模块,用于基于所述多个OCT医学图像以及对应的所述多个组织结构标注图像,划分出第一训练集和第一验证集;
[0031]图像采样模块,用于在图像宽度方向上对所述第一训练集和所述第一验证集中的图像进行采样,得到对应的第二训练集和第二验证集;
[0032]模型选择模块,用于基于所述第二训练集和所述第二验证集,对至少一个候选模型进行训练并确定出目标模型,以便用于对OCT医学图像进行图像分割。
[0033]第三方面,本公开还提供了一种电子设备,包括:
[0034]至少一个处理器;以及
[0035]与所述至少一个处理器通信连接的存储器;其中,
[0036]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开任一方法实施例所述的模型训练方法。
[0037]第四方面,本公开还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开任一方法实施例所述的模型训练方法。
[0038]从上述技术方案可知,本公开至少具有以下技术效果:
[0039]在图像样本采集方面,突破了单一设备型号、单一扫描模式的限制,采集了源自多型号设备、以多模式拍摄的大量图像,使得本公开实施例中的训练模型可以适用于大规模多源图像数据。通过对多渠道获取的眼底OCT图像做采样处理,不仅统一了图像尺寸,还扩
增了图像数量。将不同规格图像输入模型训练,提高了图像分割模型的泛化性。在图像标注方面,对眼底OCT图像进行了包括视盘区域的精细化标注,极大扩充了带精细标注的数据量。在模型开发方面,建立了一种端到端的训练模型,经过模型标准框架选择和调优,区别于现有方案多阶段、多模块的特点,端到端模型可减少误差传播的途径,实现模型整体优化,从而可以快速、准确地对来源多样的眼底OCT图像进行组织结构分割,并在大规模图像上验证了其结果的准确性。
附图说明
[0040]为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0041]图1示例性示出了本公开实施例的一种模型训练方法的流程图;
[0042]图2示例性示出了本公开实施例的眼底图像;
[0043]图3示例性示出了本公开实施例的对应图2的标注图像;
[0044]图4示例性示出了本公开实施例的图2中涉及的各眼底组织结构;
[0045]图5示例性示出了本公开实施例的对应于图2的模型预测结果图;
[0046]图6示例性示出了本公开实施例的模型训练装置的结构示意图。
具本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,包括:获取多个OCT医学图像以及对应的多个关于组织结构的标注图像;基于所述多个OCT医学图像以及对应的所述多个组织结构标注图像,划分出第一训练集和第一验证集;在图像宽度方向上对所述第一训练集和所述第一验证集中的图像进行采样,得到对应的第二训练集和第二验证集;基于所述第二训练集和所述第二验证集,对至少一个候选模型进行训练并确定出目标模型,以便用于对OCT医学图像进行图像分割。2.根据权利要求1所述的方法,其中,在图像宽度方向上对所述第一训练集和所述第一验证集中的图像进行采样,包括:在图像宽度方向上,以特定步长滑动满足特定窗口宽度的窗口,分别对所述第一训练集和所述第一验证集中的图像进行裁剪,其中,所述特定步长小于所述特定窗口宽度。3.根据权利要求2所述的方法,还包括:在图像高度方向上,对所述第一训练集和所述第一验证集中已完成图像宽度方向上的采样得到的图像进行填充,以使通过图像宽度方向上的采样得到的图像在图像高度方向上达到预定高度值,其中,所述预定高度值为2的幂次。4.根据权利要求1所述的方法,其中:所述OCT医学图像包括眼底OCT图像;所述关于组织结构的标注图像是对对应眼底OCT图像中涉及眼后节特定组织结构和/或眼后节特定组织结构间进行图像分割和标注得到的,其中,所述眼后节特定组织结构包括以下组织结构中的一种或多种:玻璃体、神经纤维层、神经节细胞层、内丛状层、内核层、外丛状层、外核层、外界膜、肌样体带、椭圆体带、神经色素上皮层、脉络膜、巩膜、视盘。5.根据权利要求1所述的方法,其中:所述多个OCT医学图像包括多个眼底OCT图像;所述多个眼底OCT图像包括:对多个患者以多种拍摄模式进行眼...

【专利技术属性】
技术研发人员:徐秋卓陈业睿杨卓榛汪霄
申请(专利权)人:图湃北京医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1