【技术实现步骤摘要】
一种通过协同主动学习模型的乳腺癌数据标注方法
本专利技术涉及医学影像数据标注领域,尤其涉及一种通过协同主动学习模型的乳腺癌数据标注方法。
技术介绍
乳腺癌是导致女性病亡的主要原因之一。据美国癌症学会估计,2018年乳腺癌新发病例数210万,占2018年全球总癌症新发病例数的11.6%,2018年全球约有63万人死于乳腺癌。全球女性乳腺癌的发病率逐年增。对于女性而言,包括中国在内的154个国家中,乳腺癌疾病发病率均居首位。目前,对乳腺癌病理图像辅助诊断的研究主要有手工提取特征的传统图像处理和基于深度学习的图像处理两种方法。主动学习是一种利用较少标注样本就可以得到一个相对性能比较好的训练模型的算法,通过对未标注样本进行选择,筛选出部分高价值的样本进行标注,就可以实现少量样本标注量的情况下进行样本标注。而协同学习是当下较流行的一种半监督学习方法,最早是由Blum与Mitchell在1998年发表的文献Combininglabeledandunlabeleddatawithco-training中提出,目前被广泛应用于众多双 ...
【技术保护点】
1.一种通过协同主动学习模型的乳腺癌数据标注方法,其特征在于,包括主动学习系统和协同学习系统;所述主动学习系统用于从样本集中取出有价值的样本供标注;所述协同学习系统通过神经网络训练后,对所述主动学习系统提供的所述有价值的样本数据进行标注。/n
【技术特征摘要】
1.一种通过协同主动学习模型的乳腺癌数据标注方法,其特征在于,包括主动学习系统和协同学习系统;所述主动学习系统用于从样本集中取出有价值的样本供标注;所述协同学习系统通过神经网络训练后,对所述主动学习系统提供的所述有价值的样本数据进行标注。
2.如权利要求1所述的方法,其特征在于,所述方法包括以下步骤:
步骤1、建立未标注样本集U,用于存储各未标注样本的标注信息与标注方式;
步骤2、通过所述主动学习系统,在所述未标注样本集U中逐一取出最有价值的样本进行人工标注,并将标注好的样本加入到已标注样本集A,该过程将持续迭代到启动自学习功能或是所述未标注样本集U与伪标注样本集F中样本数量均为0;
步骤3、启动自学习功能,利用所述已标注样本集A与所述伪标注样本集F训练MLO深度学习网络和CC深度学习网络,并构建所述协同学习系统;
步骤4、将构建好的所述协同学习系统用于所述未标注样本集U,在每次迭代中逐一取出置信度最高的所述未标注样本,通过所述协同学习系统对其进行智能标注,从而获得所述伪标注样本集F,持续迭代到关闭所述自学习功能或是所述未标注样本集U中样本数量为0;
步骤5、当所述自学习功能关闭时,回到所述步骤2。
3.如权利要求2所述的方法,其特征在于,所述步骤1还包括建立一个n*2的向量,n为所述未标注样本集U数量...
【专利技术属性】
技术研发人员:顾力栩,杨智凯,赵愉,马愈祥,张宏,
申请(专利权)人:上海交通大学,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。