The invention discloses a training method for cervical cancer recognition model based on active learning, which comprises the following steps: preparing a plurality of cervical cancer slice digital images and constructing the same library, training the recognition model with the cervical cancer slice digital images in the sample library, and aiming at each cervical cancer slice digital image in the sample library. After the recognition of the recognition model, the corresponding recognition result is output, and the recognition result includes the cells which are difficult to recognize by the recognition model; in the recognition result, the cells which are difficult to recognize are labeled by artificial labeling method, and the labeled digital image of cervical cancer is updated to the sample database, and is retrained. Compared with the prior art, the invention has the advantages of fast recognition speed, high recognition accuracy and automatic filtering of a large number of cervical cancer cells with obvious characteristics.
【技术实现步骤摘要】
基于主动学习的宫颈癌识别模型训练方法
本专利技术涉及癌症识别领域,尤其涉及一种基于主动学习的宫颈癌识别模型训练方法。
技术介绍
宫颈癌是一种严重危害女性生殖健康的恶性肿瘤,据不完全统计,全球每年宫颈癌的新发病例将近50万人,而我国宫颈癌每年的新发病例约为13.2万人,约占世界总数的28%。为了提高宫颈癌诊断的准确率,近些年,国内外许多医学研究团队开始致力于研究各种宫颈癌细胞的识别方法,但目前国内外大多识别算法仍然采用有监督的识别模型,也就是说,这种识别模型还是需要经过标注医生大量的人工标注才能得到较高地宫颈癌细胞识别率。但由于目前宫颈癌的数字图像分辨率很高,标注医生标注病变细胞需要仔细查看图像的每一个角落,这给医生带去了很大的工作负担。而且,通常情况下,每一张宫颈癌数字图像都存在大量特征明显的病变细胞,标注医生如果每次都需要将这些特征明显的病变细胞一一标注出来,会增加他们日常工作的重复度,而且这些特征明显的病变细胞对训练识别模型意义不大。所以,希望研究一种可基于主动学习的宫颈癌识别模型训练方法,以降低标注医生的工作强度,提高宫颈癌细胞的识别率。
技术实现思路
本专利技 ...
【技术保护点】
1.一种基于主动学习的宫颈癌识别模型训练方法,其特征在于,预先准备多张宫颈癌切片数字图像并构建一样本库,采用所述样本库训练形成一用于对宫颈癌细胞进行识别的识别模型;训练所述识别模型的过程具体包括:步骤1:采用所述样本库中的所述宫颈癌切片数字图像对所述识别模型进行训练;步骤2:针对所述样本库中的每张所述宫颈癌切片数字图像,通过所述识别模型的识别后输出相应的识别结果,所述识别结果中包括所述识别模型难以识别的细胞;步骤3:于所述识别结果中,采用人工标注的方式对难以识别的细胞进行标注,并将标注后的所述宫颈癌数字图像更新至所述样本库中,随后返回所述步骤1,并在所有所述识别结果中均不存 ...
【技术特征摘要】
1.一种基于主动学习的宫颈癌识别模型训练方法,其特征在于,预先准备多张宫颈癌切片数字图像并构建一样本库,采用所述样本库训练形成一用于对宫颈癌细胞进行识别的识别模型;训练所述识别模型的过程具体包括:步骤1:采用所述样本库中的所述宫颈癌切片数字图像对所述识别模型进行训练;步骤2:针对所述样本库中的每张所述宫颈癌切片数字图像,通过所述识别模型的识别后输出相应的识别结果,所述识别结果中包括所述识别模型难以识别的细胞;步骤3:于所述识别结果中,采用人工标注的方式对难以识别的细胞进行标注,并将标注后的所述宫颈癌数字图像更新至所述样本库中,随后返回所述步骤1,并在所有所述识别结果中均不存在难以识别的细胞时转向步骤4;步骤4:所述识别模型训练完毕并进行保存,随后退出。2.如权利要求1所述的基于主动学习的宫颈癌识别模型训练方法,其特征在于:所述步骤2中,判断所述宫颈癌切片数字图像中的细胞是否为难以识别的细胞的步骤具体包括:步骤21:所述识别模型对所述宫颈癌切片数字图像中的每一个细胞进行识别,并输出每一个细胞的置信度集合,所述置信度集合中包括对应的细胞分属于不同类别的各个置信度;步骤22:根据所述置信度集合中数值最高的两个所述置信度处理得到对应的细胞的识别难易度;步骤23:判断所述识别难易度是否大于一预设阈值:若是,则表示对应的细胞可以被识别;若否,则表示对应的细胞难以被识别。3.如权利要求2所述的基于主动学习的宫颈癌识别模型训练方法,其特征在于,所述预设阈值为0.4。4.如权利要求1所述的基于主动学习的宫颈癌识别模型训练方法,其特征在于:所述识别模型采用基于SSD的目标检测方法对所述宫颈癌切片数字图像中的细胞进行识别,其具体识别步骤包括:步骤S1,于所述识别模型中根据所述样本库构建宫颈癌特征提取网络,在所述宫颈癌切片数字图像中包含符合宫颈癌细胞特征的...
【专利技术属性】
技术研发人员:刘炳宪,谢菊元,王焱辉,王克惠,龙希,
申请(专利权)人:宁波江丰生物信息技术有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。