【技术实现步骤摘要】
训练分类模型、数据分类方法、装置、设备、介质及产品
[0001]本公开涉及人工智能
,尤其涉及深度学习、计算机视觉
,可应用于医学影像处理场景。
技术介绍
[0002]自监督对比学习是无监督学习的一种,能够从无标注的数据中学习知识,随着自监督对比学习的发展,从特征层面取得了很好的效果。例如,在人工智能的数据分类中,使用自监督对比学习方式能够对影像等图像数据进行分类,比如对医学图像数据进行分级。
[0003]对于有监督模型,需要大量高质量标注的样本提高学习效果。对于数据标注成本高,有标注样本相对较少、标注质量差的情况,有监督模型往往泛化能力不够强,且标注本身的噪声限制了有监督分类模型的上限。
技术实现思路
[0004]本公开提供了一种用于训练分类模型方法、数据分类方法、装置、设备、介质及产品。
[0005]根据本公开的一方面,提供了一种训练分类模型的方法,包括:利用分类模型的第一网络分支对第一训练图像进行分类预测,并基于得到的分类预测结果,确定所述第一训练图像对应的分类损失;利用所述分类模型的第二网络分支提取所述第一训练图像的第一图像特征,并提取第二训练图像的第二图像特征;基于所述第一图像特征与所述第二图像特征,确定对比损失;基于所述分类损失以及所述对比损失,更新所述分类模型的参数,得到训练完成的分类模型。
[0006]根据本公开的另一方面,提供了一种数据分类方法,包括:
[0007]确定待分类数据;将所述待分类数据输入至分类模型,得到所述分类模型的输出结果; ...
【技术保护点】
【技术特征摘要】
1.一种训练分类模型的方法,包括:利用分类模型的第一网络分支对第一训练图像进行分类预测,并基于得到的分类预测结果,确定所述第一训练图像对应的分类损失;利用所述分类模型的第二网络分支提取所述第一训练图像的第一图像特征,并提取第二训练图像的第二图像特征;基于所述第一图像特征与所述第二图像特征,确定对比损失;基于所述分类损失以及所述对比损失,更新所述分类模型的参数,得到训练完成的分类模型。2.根据权利要求1所述的方法,其中,所述对比损失通过多分类版本的噪声对比估计损失函数确定。3.根据权利要求1或2所述的方法,其中,所述基于所述分类损失以及所述对比损失,更新所述分类模型的参数,包括:基于所述分类损失,利用反向传播更新所述第一网络分支的参数,并基于所述对比损失,利用反向传播更新所述第一网络分支的参数;基于更新后的所述第一网络分支的参数,通过动量更新所述第二网络分支的参数。4.根据权利要求1所述的方法,其中,所述利用分类模型的第一网络分支对所述第一训练图像进行分类预测,并基于得到的分类预测结果,确定所述第一训练图像对应的分类损失,包括:将所述第一训练图像输入至分类模型的第一网络分支的分类器,得到对所述第一训练图像进行分类预测的分类预测结果;基于所述分类预测结果与所述训练图像的标注信息,确定所述第一训练图像对应的交叉熵分类损失。5.根据权利要求1所述的方法,其中,所述利用所述分类模型的第二网络分支提取所述第一训练图像的第一图像特征,以及所述第二训练图像的第二图像特征,包括:利用所述第二网络分支中第一分支的投影器与预测器,提取所述第一训练图像的第一图像特征;利用所述第二网络分支中第二分支的投影器,提取所述第二训练图像的第二图像特征。6.根据权利要求1
‑
5中任意一项所述的方法,其中,所述第一训练图像和所述第二训练图像通过对训练图像进行不同次的数据增强得到。7.一种数据分类方法,包括:确定待分类数据;将所述待分类数据输入至分类模型,得到所述分类模型的输出结果;基于所述分类模型的输出结果,确定所述待分类数据的分类结果;其中,所述分类模型包括第一网络分支和第二网络分支,并基于分类损失以及对比损失进行参数更新后预先训练得到;所述第一网络分支用于对第一训练图像进行分类预测,得到所述第一训练图像的分类预测结果;所述第二网络分支用于提取所述第一训练图像的第一图像特征以及第二训练图像的
第二图像特征;其中,所述分类损失通过所述第一训练图像的分类预测结果确定,所述对比损失基于所述第一图像特征与所述第二图像特征确定。8.根据权利要求7所述的方法,其中,所述第一训练图像的分类预测结果基于所述第一网络分支的分类器得到;所述分类损失为所述第一训练图像的交叉熵分类损失,所述第一训练图像的交叉熵分类损失基于所述第一训练图像的分类预测结果以及训练图像的标注信息确定;所述第一训练图像通过对所述训练图像进行数据增强得到。9.根据权利要求7所述的方法,其中,所述第一训练图像的第一图像特征利用所述第二网络分支中第一分支的投影器与预测器提取;所述第二训练图像的第二图像特征利用所述第二网络分支中第二分支的投影器提取。10.根据权利要求7所述的方法,其中,所述待分类数据为医学影像数据。11.一种训练分类模型的装置,包括:确定模块,用于利用分类模型的第一网络分支对第一训练图像进行分类预测,并基于得到的分类预测结果,确定所述第一训练图像对应的分类损失,以及,基于第一图像特征与第二图像特征,确定对比损失;提取模块,利用所述分类模型的第二网络分支提取所述第一训练图像的第一图像特征,并提取第二训练图像的第二图像特征;更新模块,用于基于所述分类损失以及所述对比损失,更新所述分类模型的参...
【专利技术属性】
技术研发人员:周文硕,杨大陆,杨叶辉,武秉泓,王晓荣,王磊,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。