【技术实现步骤摘要】
标签的校准方法、装置、设备及存储介质
[0001]本申请涉及机器学习
,特别涉及一种标签的校准方法、装置、设备及存储介质。
技术介绍
[0002]随着机器学习技术的发展,在医疗场景中开始出现不同的医疗机构通过利用各自的样本医疗图像数据进行合作学习。但不同医疗机构的样本医疗图像数据中通常会存在大量的标签噪声(标注错误)。
[0003]相关技术中,通过对样本医疗图像数据进行误差判定,实现对标签噪声的过滤。
[0004]但是上述方法在实现过滤标签噪声的时候,会存在将一些困难样本医疗图像数据(例如罕见病样本)误识别为标签噪声的可能性。
技术实现思路
[0005]本申请提供了一种标签的校准方法、装置、设备及存储介质。所述技术方案如下:
[0006]根据本申请的一方面,提供了一种标签的校准方法,所述方法包括:
[0007]获取样本医疗图像数据组,所述样本医疗图像数据组中包括至少两个样本医疗图像数据,所述至少两个样本医疗图像数据中包括第一样本医疗图像数据,和除所述第一样本医疗图像数据之外的其它样本医疗图像数据;
[0008]基于所述第一样本医疗图像数据和每个所述其他样本医疗图像数据之间的特征差距值,将所述其它样本医疗图像数据中的第二样本医疗图像数据纳入所述第一样本医疗图像数据的特征邻域,所述第二样本医疗图像数据是所述其他样本医疗图像数据中的一个或多个样本医疗图像数据;
[0009]在所述第一样本医疗图像数据对应的医疗标签和所述第一样本医疗图像数据的特征邻域内的所 ...
【技术保护点】
【技术特征摘要】
1.一种标签的校准方法,其特征在于,所述方法包括:获取样本医疗图像数据组,所述样本医疗图像数据组中包括至少两个样本医疗图像数据,所述至少两个样本医疗图像数据中包括第一样本医疗图像数据,和除所述第一样本医疗图像数据之外的其它样本医疗图像数据;基于所述第一样本医疗图像数据和每个所述其他样本医疗图像数据之间的特征差距值,将所述其它样本医疗图像数据中的第二样本医疗图像数据纳入所述第一样本医疗图像数据的特征邻域,所述第二样本医疗图像数据是所述其他样本医疗图像数据中的一个或多个样本医疗图像数据;在所述第一样本医疗图像数据对应的医疗标签和所述第一样本医疗图像数据的特征邻域内的所述样本医疗图像数据对应的医疗标签存在不同的情况下,对所述第一样本医疗图像数据对应的医疗标签进行校准。2.根据权利要求1所述的方法,其特征在于,所述在所述第一样本医疗图像数据对应的医疗标签和所述第一样本医疗图像数据的特征邻域内的所述样本医疗图像数据对应的医疗标签存在不同的情况下,对所述第一样本医疗图像数据对应的医疗标签进行校准,包括:在所述第一样本医疗图像数据对应的医疗标签和所述第一样本医疗图像数据的特征邻域内的样本医疗图像数据对应的医疗标签存在不同的情况下,计算所述第一样本医疗图像数据的特征邻域内的各个所述样本医疗图像数据对应的医疗标签的平均值;将所述第一样本医疗图像数据对应的医疗标签校准为所述平均值。3.根据权利要求2所述的方法,其特征在于,所述计算所述第一样本医疗图像数据的特征邻域内的各个所述样本医疗图像数据对应的医疗标签的平均值,包括:对所述第一样本医疗图像数据的特征邻域内的各个所述样本医疗图像数据和所述第一样本医疗图像数据的特征差距值进行求和,得到各个所述样本医疗图像数据对应的所述特征差距值的和;将各个所述特征差距值和各自对应的所述医疗标签相乘,得到所述特征差距值和各自对应的所述医疗标签的乘积值;将所述特征差距值的和作为除数,将所述乘积值作为被除数,计算所述乘积值和所述特征差距值的和的商;对各个所述特征差距值对应的所述商进行累加求和,将得到的累加和作为所述平均值。4.根据权利要求1至3任一所述的方法,其特征在于,所述样本医疗图像数据分别来自不同医疗机构的医疗图像数据集,所述医疗图像数据集中包括至少两个所述样本医疗图像数据;所述方法还包括:基于所述样本医疗图像数据的特征相似度,对所述医疗图像数据集中的同类样本医疗图像数据进行合并,得到所述样本医疗图像数据组。5.根据权利要求4所述的方法,其特征在于,所述医疗图像数据集包括第一医疗图像数据集和第二医疗图像数据集;所述基于所述样本医疗图像数据的特征相似度,对所述医疗图像数据集中的同类样本医疗图像数据进行合并,得到所述样本医疗图像数据组,包括:
基于所述样本医疗图像数据的特征,计算所述第一医疗图像数据集和所述第二医疗图像数据集的数据相似度;计算所述第一医疗图像数据集和所述第二医疗图像数据集的噪声相似度;基于所述数据相似度和所述噪声相似度,将所述第一医疗图像数据集和所述第二医疗图像数据集进行合并,得到所述样本医疗图像数据组。6.根据权利要求5所述的方法,其特征在于,所述基于所述数据相似度和所述噪声相似度,将所述第一医疗图像数据集和所述第二医疗图像数据集进行合并,得到所述样本医疗图像数据组,包括:在所述数据相似度大于第一阈值且所述噪声相似度大于第二阈值的情况下,将所述第一医疗图像数据集和所述第二医疗图像数据集进行合并,得到所述样本医疗图像数据组;其中,所述第一阈值是所述数据相似度的阈值,所述第二阈值是所述噪声相似度的阈值。7.根据权利要求5所述的方法,其特征在于,所述基于所述样本医疗图像数据的特征,计算所述第一医疗图像数据集和所述第二医疗图像数据集的数据相似度,包...
【专利技术属性】
技术研发人员:吴秉哲,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。