图像数据筛选、图像分割模型训练方法、装置和存储介质制造方法及图纸

技术编号:31230206 阅读:14 留言:0更新日期:2021-12-08 10:00
本申请涉及一种图像数据筛选方法、装置、计算机设备和存储介质。所述方法包括:对各个待筛选图像进行预分割,得到各个待筛选图像对应的图像分割类别概率,基于图像分割类别概率计算得到各个待筛选图像对应的图像筛选度;基于图像筛选度从各个待筛选图像中进行筛选,得到第一筛选图像集和未选取图像集;计算第一筛选图像集与未选取图像集的第一相似度,基于第一相似度从第一筛选图像集中进行代表性图像筛选,得到第二筛选图像集;计算第二筛选图像集与已标注图像集的第二相似度,基于第二相似度从第二筛选图像集中进行多样性图像筛选,得到第一目标图像集,第一目标图像集用于训练图像分割模型。采用本方法能够提高图像数据筛选的质量。的质量。的质量。

【技术实现步骤摘要】
图像数据筛选、图像分割模型训练方法、装置和存储介质


[0001]本申请涉及计算机
,特别是涉及一种图像数据筛选、图像分割模型训练以及图像数据处理方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着人工智能技术的发展,出现了图像分割技术,图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。目前,通常通过训练图像分割人工智能模型来对图像进行分割。即通过获取到大量标注的图像进行图像分割训练。由于图像分割任务在对图像进行标注时需要花费大量时间,导致图像分割模型的训练需要花费较长时间。比如,对肿瘤图像进行肿瘤区域分割模型的训练时,需要对大量训练图像进行标注,需要花费大量时间。目前,通常是随机选取少量的图像进行标注后进行图像分割模型的训练。然而,随机选取的少量图像可能会使得到训练图像的质量降低,导致训练得到的图像分割模型的图像分割准确性降低。

技术实现思路

[0003]基于此,有必要针对上述技术问题,提供一种能够提高训练图像质量,进而提高图像分割准确性和图像分割效率的图像数据筛选、图像分割模型训练以及图像数据处理方法、装置、计算机设备和存储介质。
[0004]一种图像数据筛选方法,所述方法包括:
[0005]获取待筛选图像集,待筛选图像集中包括各个待筛选图像;
[0006]对各个待筛选图像进行预分割,得到各个待筛选图像对应的图像分割类别概率,并基于图像分割类别概率进行图像筛选可能性的计算,得到各个待筛选图像对应的图像筛选度;
[0007]基于图像筛选度从各个待筛选图像中进行筛选,得到第一筛选图像集和未选取图像集;
[0008]计算第一筛选图像集与未选取图像集的第一相似度,基于第一相似度从第一筛选图像集中进行代表性图像筛选,得到第二筛选图像集;
[0009]获取已标注图像集,已标注图像集和待筛选图像集中的图像属于同类型图像,计算第二筛选图像集与已标注图像集的第二相似度,基于第二相似度从第二筛选图像集中进行多样性图像筛选,得到第一目标图像集,第一目标图像集用于在获取到图像分割类别标签后训练图像分割模型。
[0010]一种图像数据筛选装置,所述装置包括:
[0011]图像获取模块,用于获取待筛选图像集,待筛选图像集中包括各个待筛选图像;
[0012]筛选度计算模块,用于对各个待筛选图像进行预分割,得到各个待筛选图像对应的图像分割类别概率,并基于图像分割类别概率进行图像筛选可能性的计算,得到各个待筛选图像对应的图像筛选度;
[0013]筛选模块,用于基于图像筛选度从各个待筛选图像中进行筛选,得到第一筛选图像集和未选取图像集;
[0014]第二筛选模块,用于计算第一筛选图像集与未选取图像集的第一相似度,基于第一相似度从第一筛选图像集中进行代表性图像筛选,得到第二筛选图像集;
[0015]目标筛选模块,用于获取已标注图像集,已标注图像集和待筛选图像集中的图像属于同类型图像,计算第二筛选图像集与已标注图像集的第二相似度,基于第二相似度从第二筛选图像集中进行多样性图像筛选,得到第一目标图像集,第一目标图像集用于在获取到图像分割类别标签后训练图像分割模型。
[0016]一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0017]获取待筛选图像集,待筛选图像集中包括各个待筛选图像;
[0018]对各个待筛选图像进行预分割,得到各个待筛选图像对应的图像分割类别概率,并基于图像分割类别概率进行图像筛选可能性的计算,得到各个待筛选图像对应的图像筛选度;
[0019]基于图像筛选度从各个待筛选图像中进行筛选,得到第一筛选图像集和未选取图像集;
[0020]计算第一筛选图像集与未选取图像集的第一相似度,基于第一相似度从第一筛选图像集中进行代表性图像筛选,得到第二筛选图像集;
[0021]获取已标注图像集,已标注图像集和待筛选图像集中的图像属于同类型图像,计算第二筛选图像集与已标注图像集的第二相似度,基于第二相似度从第二筛选图像集中进行多样性图像筛选,得到第一目标图像集,第一目标图像集用于在获取到图像分割类别标签后训练图像分割模型。
[0022]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0023]获取待筛选图像集,待筛选图像集中包括各个待筛选图像;
[0024]对各个待筛选图像进行预分割,得到各个待筛选图像对应的图像分割类别概率,并基于图像分割类别概率进行图像筛选可能性的计算,得到各个待筛选图像对应的图像筛选度;
[0025]基于图像筛选度从各个待筛选图像中进行筛选,得到第一筛选图像集和未选取图像集;
[0026]计算第一筛选图像集与未选取图像集的第一相似度,基于第一相似度从第一筛选图像集中进行代表性图像筛选,得到第二筛选图像集;
[0027]获取已标注图像集,已标注图像集和待筛选图像集中的图像属于同类型图像,计算第二筛选图像集与已标注图像集的第二相似度,基于第二相似度从第二筛选图像集中进行多样性图像筛选,得到第一目标图像集,第一目标图像集用于在获取到图像分割类别标签后训练图像分割模型。
[0028]上述图像数据筛选方法、装置、计算机设备和存储介质,通过计算各个待筛选图像对应的图像筛选度,使用图像筛选度筛选,得到第一筛选图像集和未选取图像集。然后从第一筛选图像集中进行代表性图像筛选,得到第二筛选图像集,进一步从第二筛选图像集中
进行多样性图像筛选,得到第一目标图像集,从而能够使得筛选得到的目标图像集中的图像具有高筛选度、代表性和多样性,提高了得到的第一目标图像集中图像的质量,然后使用第一目标图像集在获取到图像分割类别标签后训练图像分割模型,由于训练图像质量较高,使得训练得到的图像分割模型能够提高图像分割的准确性,并且只需要获取到第一目标图像集的图像分割类别标签就能训练得到图像分割模型,不需要获取到所有待筛选图像的图像分割类别标签,从而能够提高图像分割模型训练效率。
[0029]一种图像分割模型训练方法,所述方法包括:
[0030]获取训练数据和预训练图像分割模型,训练数据包括预训练图像集和新增图像集,预训练图像集用于训练得到预训练图像分割模型,新增图像集是目标图像集获取到图像分割类别标签后得到的;
[0031]目标图像集是通过预训练图像分割模型计算各个待筛选图像对应的图像分割类别概率,并基于图像分割类别概率计算得到图像筛选度,使用图像筛选度从各个待筛选图像中进行筛选,得到第一筛选图像集和未选取图像集,计算第一筛选图像集与未选取图像集的第一相似度,基于第一相似度从第一筛选图像集中进行代表性图像筛选,得到第二筛选图像集,并计算第二筛选图像集与预训练图像集的第二相似度,基于第二相似度从第二筛选图像集中进行多样性图像筛选得到的;
[0032]将训练数据输入预训练图像分割模型中进行图像分割,得本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像数据筛选方法,其特征在于,所述方法包括:获取待筛选图像集,所述待筛选图像集中包括各个待筛选图像;对所述各个待筛选图像进行预分割,得到所述各个待筛选图像对应的图像分割类别概率,并基于所述图像分割类别概率进行图像筛选可能性的计算,得到所述各个待筛选图像对应的图像筛选度;基于所述图像筛选度从各个待筛选图像中进行筛选,得到第一筛选图像集和未选取图像集;计算所述第一筛选图像集与所述未选取图像集的第一相似度,基于所述第一相似度从所述第一筛选图像集中进行代表性图像筛选,得到第二筛选图像集;获取已标注图像集,所述已标注图像集和所述待筛选图像集中的图像属于同类型图像,计算所述第二筛选图像集与所述已标注图像集的第二相似度,基于所述第二相似度从所述第二筛选图像集中进行多样性图像筛选,得到第一目标图像集,所述第一目标图像集用于在获取到图像分割类别标签后训练图像分割模型。2.根据权利要求1所述的方法,其特征在于,所述对所述各个待筛选图像进行预分割,得到所述各个待筛选图像对应的图像分割类别概率,并基于所述图像分割类别概率进行图像筛选可能性的计算,得到所述各个待筛选图像对应的图像筛选度,包括:将所述各个待筛选图像输入到预训练图像分割模型中进行预分割,得到输出的所述各个待筛选图像对应的像素级图像分割类别概率;基于所述各个待筛选图像对应的像素级图像分割类别概率进行信息度计算,得到所述各个待筛选图像对应的图像分割信息度;基于所述各个待筛选图像对应的像素级图像分割类别概率进行预分割精确度计算,得到各个待筛选图像对应的图像分割精确度;基于所述图像分割信息度和所述图像分割精确度进行加权计算,得到所述各个待筛选图像对应的图像筛选度。3.根据权利要求2所述的方法,其特征在于,所述预训练图像分割模型包括随机置零网络;所述将所述各个待筛选图像输入到预训练图像分割模型中进行预分割,得到输出的所述各个待筛选图像对应的像素级图像分割类别概率,包括:将所述各个待筛选图像输入到预训练图像分割模型中,所述预训练图像分割模型通过所述随机置零网络将预训练模型参数随机置零并进行预分割,得到每个待筛选图像对应的各个像素级图像分割类别概率;基于所述每个待筛选图像对应的各个像素级图像分割类别概率进行融合,得到各个待筛选图像对应的像素级图像分割类别概率。4.根据权利要求2所述的方法,其特征在于,所述基于所述各个待筛选图像对应的像素级类别概率进行信息度计算,得到所述各个待筛选图像对应的图像分割信息度,包括:基于所述各个待筛选图像对应的像素级类别概率进行信息熵计算,得到像素级分割信息熵,将所述像素级分割信息熵归一化,得到所述各个待筛选图像对应的像素级分割信息度;将所述像素级分割信息度进行融合,得到所述各个待筛选图像对应的图像分割信息
度。5.根据权利要求3所述的方法,其特征在于,所述基于所述各个待筛选图像对应的像素级图像分割类别概率进行预分割精确度计算,得到各个待筛选图像对应的图像分割精确度,包括:获取所述每个待筛选图像对应的各个像素级图像分割类别概率,将每个待筛选图像对应的各个像素级图像分割类别概率分别进行二值化,得到所述每个待筛选图像对应的各个二值图;基于所述各个二值图进行交集计算,得到重叠区域,并基于所述各个二值图进行并集计算,得到合并区域;计算所述重叠区域与所述合并区域的比值,得到所述每个待筛选图像对应的图像分割精确度。6.根据权利要求2所述的方法,其特征在于,所述基于所述图像分割信息度和所述图像分割精确度进行加权计算,得到所述各个待筛选图像对应的图像筛选度,包括:获取目标权重,计算所述图像分割精确度与所述目标权重的加权精确度;计算所述图像分割信息度与加权精确度的差异,得到所述各个待筛选图像对应的图像筛选度。7.根据权利要求1所述的方法,其特征在于,所述计算所述第一筛选图像集与所述未选取图像集的第一相似度,基于所述第一相似度从所述第一筛选图像集中进行代表性图像筛选,得到第二筛选图像集,包括:分别提取所述第一筛选图像集中各个第一筛选图像与所述未选取图像集中各个未选取图像的图像特征,得到各个第一筛选图像特征和各个未选取图像特征;计算所述各个第一筛选图像特征与所述各个未选取图像特征的第一相似度,得到相似度矩阵;基于所述相似度矩阵进行代表性图像筛选,得到第二筛选图像集。8.根据权利要求7所述的方法,其特征在于,所述相似度矩阵中行属性表征第一筛选图像、列属性表征未选取图像以及矩阵值为第一相似度;所述基于所述相似度矩阵进行代表性图像筛选,得到第二筛选图像集,包括:基于所述相似度矩阵计算各个第一筛选图像对应的总相似度,从所述总相似度和中确定最大总相似度,将所述最大总相似度对应的第一筛选图像作为第一代表图像;将所述相似度矩阵中所述第一代表图像对应的各个相似度分别与所述相似度矩阵中除所述第一代表图像以外的第一筛选图像对应的各个相似度级联,得到各个相似度级联矩阵,并从所述各个相似度级联矩阵按列选取最大相似度,得到各个目标行对应的相似度;基于所述各个目标行对应的相似度计算所述各个目标行对应的目标总相似度,从所述目标总相似度中确定最大目标总相似度,将所述最大目标总相似度对应的第一筛选图像作为第二代表图像;将所述相似度矩阵中所述第一代表图像和所述第二代表图像对应的各个相似度分别与除所述第一代表图像和所述第二代表图像以外的第一筛选图像对应的各个相似度级联,并迭代执行,直到选取第一目标数量的代表图像时,基于所述第一目标数量的代表图像得到第二筛选图像集。
9.根据权利要求1所述的方法,其特征在于,所述获取已标注图像集,所述已标注图像集和所述待筛选图像集中的图像属于同类型图像,计算所述第二筛选图像集与所述已标注图像集的第二相似度,基于所述第二相似度从所述第二筛选图像集中进行多样性图像筛选,得到第一目标图像集,包括:分别提取所述已标注图像集中各个已标注图像与所述第二筛选图像集中各个第二筛选图像的图像特征,得到各个已标注图像特征和各个第二筛选图像特征;计算所述各个第二筛选图像特征与所述各个已标注图像特征的第二相似度,并基于所述第二相似度得到区别度矩阵;基于所述区别度矩阵进行多样性图像筛选,得到第一目标图像集。10.根据权利要求9所述的方法,其特征在于,所述区别度矩阵中行属性表征第二筛选图像、列属性表征已标注图像以及矩阵值为区别度;所述基于所述区别度矩阵进行多样性图像筛选,得到第一目标图像集,包括:基于所述区别度矩阵计算各个第二筛选图像对应的总区别度,从所述总区别度中确定最大总区别度,将所述最大总区别度对应的第二筛选图像作为第一多样性图像;将所述区别度矩阵中所述第一多样性图像对应的各个区别度分别与所述区别度矩阵中除所述第一多样性图像以外的第二筛选图像对应的各个区别度级联,得到各个区别度级联矩阵,从所述各个区别度级联矩阵中按列选取最大区别度,得到各个目标行对应的区别度;基于所述各个目标行对应的区别度计算所述各个目标行对应的目标总区别度,从所述目标总区别度中确定最大目标总区别度,将所述最大目标总区别度对应的第二筛选图像作为第二多样性图像;将所述区别度矩阵中所述第一多样性图像和所述第二多样性图像对应的各个区别度分别与所述除所述第一多样性图像和所述第二多样性图像以外的第二筛选图像对应的各个区别度级联,并迭代执行,直到选取第二目标数量的多样性图像时,基于所述第二目标数量的多样性图像得到第一目标图像集。11.根据权利要求1所述的方法,其特征在于,所述方法,还包括:对所述各个待筛选图像进行聚类,得到各个聚类图像集;分别从所述各个聚类图像集中选取聚类图像,得到代表性图像集;对所述代表性图像集中各个代表性图像进行预分割,得到所述各个代表性图像对应的代表性图像分割类别概率,并基于所述代表性图像分割类别概率进行图像筛选可能性的计算,得到所述各个代表性图像对应的代表性图像筛选度;基于所述代表性图像筛选度从各个代表性图像中进行筛选,得到代表性图像筛选集;所述获取已标注图像集,所述已标注图像集和所述待筛选图像集中的图像属于同类型图像,计算所述第二筛选图像集与所述已标注图像集的相似度,基于所述相似度从所述第二筛选图像集中进行多样性图像筛选,得到第一目标图像集,包括:获取已标注图像集,计算所述代表性图像筛选集与所述已标注图像集的代表相似度,基于所述...

【专利技术属性】
技术研发人员:沈昊成
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1