标签的校准方法、装置、设备及存储介质制造方法及图纸

技术编号:39253710 阅读:9 留言:0更新日期:2023-10-30 12:05
本申请公开了一种标签的校准方法、装置、设备及存储介质,属于机器学习技术领域。该方法包括:获取样本医疗图像数据组,样本医疗图像数据组中包括第一样本医疗图像数据,和除第一样本医疗图像数据之外的其它样本医疗图像数据;基于第一样本医疗图像数据和每个其他样本医疗图像数据之间的特征差距值,将其它样本医疗图像数据中的第二样本医疗图像数据纳入第一样本医疗图像数据的特征邻域;在第一样本医疗图像数据对应的医疗标签和第一样本医疗图像数据的特征邻域内的样本医疗图像数据对应的医疗标签存在不同的情况下,对第一样本医疗图像数据对应的医疗标签进行校准。该方法能够帮助减少样本医疗图像数据组中的标签噪声。够帮助减少样本医疗图像数据组中的标签噪声。够帮助减少样本医疗图像数据组中的标签噪声。

【技术实现步骤摘要】
标签的校准方法、装置、设备及存储介质


[0001]本申请涉及机器学习
,特别涉及一种标签的校准方法、装置、设备及存储介质。

技术介绍

[0002]随着机器学习技术的发展,在医疗场景中开始出现不同的医疗机构通过利用各自的样本医疗图像数据进行合作学习。但不同医疗机构的样本医疗图像数据中通常会存在大量的标签噪声(标注错误)。
[0003]相关技术中,通过对样本医疗图像数据进行误差判定,实现对标签噪声的过滤。
[0004]但是上述方法在实现过滤标签噪声的时候,会存在将一些困难样本医疗图像数据(例如罕见病样本)误识别为标签噪声的可能性。

技术实现思路

[0005]本申请提供了一种标签的校准方法、装置、设备及存储介质。所述技术方案如下:
[0006]根据本申请的一方面,提供了一种标签的校准方法,所述方法包括:
[0007]获取样本医疗图像数据组,所述样本医疗图像数据组中包括至少两个样本医疗图像数据,所述至少两个样本医疗图像数据中包括第一样本医疗图像数据,和除所述第一样本医疗图像数据之外的其它样本医疗图像数据;
[0008]基于所述第一样本医疗图像数据和每个所述其他样本医疗图像数据之间的特征差距值,将所述其它样本医疗图像数据中的第二样本医疗图像数据纳入所述第一样本医疗图像数据的特征邻域,所述第二样本医疗图像数据是所述其他样本医疗图像数据中的一个或多个样本医疗图像数据;
[0009]在所述第一样本医疗图像数据对应的医疗标签和所述第一样本医疗图像数据的特征邻域内的所述样本医疗图像数据对应的医疗标签存在不同的情况下,对所述第一样本医疗图像数据对应的医疗标签进行校准。
[0010]根据本申请的另一方面,提供了一种标签的校准装置,所述装置包括:
[0011]获取模块,用于获取样本医疗图像数据组,所述样本医疗图像数据组中包括至少两个样本医疗图像数据,所述至少两个样本医疗图像数据中包括第一样本医疗图像数据,和除所述第一样本医疗图像数据之外的其它样本医疗图像数据;
[0012]确定模块,用于基于所述第一样本医疗图像数据和每个所述其他样本医疗图像数据之间的特征差距值,将所述其它样本医疗图像数据中的第二样本医疗图像数据纳入所述第一样本医疗图像数据的特征邻域,所述第二样本医疗图像数据是所述其他样本医疗图像数据中的一个或多个样本医疗图像数据;
[0013]校准模块,用于在所述第一样本医疗图像数据对应的医疗标签和所述第一样本医疗图像数据的特征邻域内的所述样本医疗图像数据对应的医疗标签存在不同的情况下,对所述第一样本医疗图像数据对应的医疗标签进行校准。
[0014]根据本申请的另一方面,提供了一种计算机设备,所述计算机设备包括:处理器和存储器,所述存储器中存储有至少一段程序,所述至少一段程序由所述处理器加载并执行,以实现如上方面所述的标签的校准方法。
[0015]根据本申请的另一方面,提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一段程序,所述至少一段程序由处理器加载并执行以实现如上方面所述的标签的校准方法。
[0016]根据本申请的另一方面,提供了一种计算机程序产品,该计算机程序产品包括至少一段程序,所述至少一段程序存储在计算机可读存储介质中;计算机设备的处理器从所述计算机可读存储介质中读取所述至少一段程序,所述处理器执行所述至少一段程序,使得所述计算机设备执行如上方面所述的标签的校准方法。
[0017]本申请提供的技术方案带来的有益效果至少包括:
[0018]通过计算样本医疗图像数据组中的第一样本医疗图像数据和每个其他样本医疗图像数据之间的特征差距值,将其他样本医疗图像数据中的第二样本医疗图像数据纳入第一样本医疗图像数据的特征邻域中,基于第一样本医疗图像数据的特征邻域中的样本医疗图像数据对应的医疗标签,对第一样本医疗图像数据对应的医疗标签进行校准,通过利用第一样本医疗图像数据和特征邻域中的其他样本医疗图像数据之间的相似性,能够帮助有效减少样本医疗图像数据组中的标签噪声,从而提升样本医疗图像数据的准确性。
附图说明
[0019]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1是本申请的一个示例性实施例提供的标签的校准方法的流程图;
[0021]图2是本申请的一个示例性实施例提供的标签的校准方法的示意图;
[0022]图3是本申请的一个示例性实施例提供的标签的校准方法的流程图;
[0023]图4是本申请的一个示例性实施例提供的标签的校准方法的流程图;
[0024]图5是本申请的一个示例性实施例提供的标签的校准方法的流程图;
[0025]图6是本申请的一个示例性实施例提供的标签的校准方法的流程图;
[0026]图7是本申请的一个示例性实施例提供的标签的校准方法的流程图;
[0027]图8是本申请的一个示例性实施例提供的标签的校准方法的流程图;
[0028]图9是本申请的一个示例性实施例提供的聚类算法的示意图;
[0029]图10是本申请的一个示例性实施例提供的聚类算法的示意图;
[0030]图11是本申请的一个示例性实施例提供的聚类算法的示意图;
[0031]图12是本申请的一个示例性实施例提供的标签的校准方法的流程图;
[0032]图13是本申请的一个示例性实施例提供的标签的校准方法的流程图;
[0033]图14是本申请的一个示例性实施例提供的标签的校准方法的流程图;
[0034]图15是本申请的一个示例性实施例提供的标签的校准方法的流程图;
[0035]图16是本申请的一个示例性实施例提供的标签的校准方法的流程图;
[0036]图17是本申请的一个示例性实施例提供的标签的校准方法的流程图;
[0037]图18是本申请的一个示例性实施例提供的标签的校准方法的流程图;
[0038]图19是本申请的一个示例性实施例提供的标签的校准方法的流程图;
[0039]图20是本申请的一个示例性实施例提供的标签的校准方法的流程图;
[0040]图21是本申请的一个示例性实施例提供的标签的校准方法的流程图;
[0041]图22是本申请的一个示例性实施例提供的标签的校准方法的流程图;
[0042]图23是本申请的一个示例性实施例提供的标签的校准方法的流程图;
[0043]图24是本申请的一个示例性实施例提供的标签的校准方法的流程图;
[0044]图25是本申请的一个示例性实施例提供的标签的校准方法的流程图;
[0045]图26是本申请的一个示例性实施例提供的标签的校准方法的流程图;
[0046]图27是本申请的一个示例性实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种标签的校准方法,其特征在于,所述方法包括:获取样本医疗图像数据组,所述样本医疗图像数据组中包括至少两个样本医疗图像数据,所述至少两个样本医疗图像数据中包括第一样本医疗图像数据,和除所述第一样本医疗图像数据之外的其它样本医疗图像数据;基于所述第一样本医疗图像数据和每个所述其他样本医疗图像数据之间的特征差距值,将所述其它样本医疗图像数据中的第二样本医疗图像数据纳入所述第一样本医疗图像数据的特征邻域,所述第二样本医疗图像数据是所述其他样本医疗图像数据中的一个或多个样本医疗图像数据;在所述第一样本医疗图像数据对应的医疗标签和所述第一样本医疗图像数据的特征邻域内的所述样本医疗图像数据对应的医疗标签存在不同的情况下,对所述第一样本医疗图像数据对应的医疗标签进行校准。2.根据权利要求1所述的方法,其特征在于,所述在所述第一样本医疗图像数据对应的医疗标签和所述第一样本医疗图像数据的特征邻域内的所述样本医疗图像数据对应的医疗标签存在不同的情况下,对所述第一样本医疗图像数据对应的医疗标签进行校准,包括:在所述第一样本医疗图像数据对应的医疗标签和所述第一样本医疗图像数据的特征邻域内的样本医疗图像数据对应的医疗标签存在不同的情况下,计算所述第一样本医疗图像数据的特征邻域内的各个所述样本医疗图像数据对应的医疗标签的平均值;将所述第一样本医疗图像数据对应的医疗标签校准为所述平均值。3.根据权利要求2所述的方法,其特征在于,所述计算所述第一样本医疗图像数据的特征邻域内的各个所述样本医疗图像数据对应的医疗标签的平均值,包括:对所述第一样本医疗图像数据的特征邻域内的各个所述样本医疗图像数据和所述第一样本医疗图像数据的特征差距值进行求和,得到各个所述样本医疗图像数据对应的所述特征差距值的和;将各个所述特征差距值和各自对应的所述医疗标签相乘,得到所述特征差距值和各自对应的所述医疗标签的乘积值;将所述特征差距值的和作为除数,将所述乘积值作为被除数,计算所述乘积值和所述特征差距值的和的商;对各个所述特征差距值对应的所述商进行累加求和,将得到的累加和作为所述平均值。4.根据权利要求1至3任一所述的方法,其特征在于,所述样本医疗图像数据分别来自不同医疗机构的医疗图像数据集,所述医疗图像数据集中包括至少两个所述样本医疗图像数据;所述方法还包括:基于所述样本医疗图像数据的特征相似度,对所述医疗图像数据集中的同类样本医疗图像数据进行合并,得到所述样本医疗图像数据组。5.根据权利要求4所述的方法,其特征在于,所述医疗图像数据集包括第一医疗图像数据集和第二医疗图像数据集;所述基于所述样本医疗图像数据的特征相似度,对所述医疗图像数据集中的同类样本医疗图像数据进行合并,得到所述样本医疗图像数据组,包括:
基于所述样本医疗图像数据的特征,计算所述第一医疗图像数据集和所述第二医疗图像数据集的数据相似度;计算所述第一医疗图像数据集和所述第二医疗图像数据集的噪声相似度;基于所述数据相似度和所述噪声相似度,将所述第一医疗图像数据集和所述第二医疗图像数据集进行合并,得到所述样本医疗图像数据组。6.根据权利要求5所述的方法,其特征在于,所述基于所述数据相似度和所述噪声相似度,将所述第一医疗图像数据集和所述第二医疗图像数据集进行合并,得到所述样本医疗图像数据组,包括:在所述数据相似度大于第一阈值且所述噪声相似度大于第二阈值的情况下,将所述第一医疗图像数据集和所述第二医疗图像数据集进行合并,得到所述样本医疗图像数据组;其中,所述第一阈值是所述数据相似度的阈值,所述第二阈值是所述噪声相似度的阈值。7.根据权利要求5所述的方法,其特征在于,所述基于所述样本医疗图像数据的特征,计算所述第一医疗图像数据集和所述第二医疗图像数据集的数据相似度,包...

【专利技术属性】
技术研发人员:吴秉哲
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1