一种面向皮肤医学数据的标签纠错方法技术

技术编号：19062429 阅读：53 留言：0更新日期：2018-09-29 13:18

本发明专利技术公开了一种面向皮肤医学数据的标签纠错方法，采用深度学习tensorflow框架和卷积神经网络GoogleNet:inception V3模型，利用迁移学习技术，将少量并含多种已标记标签的皮肤病图像数据集作为训练样本，放入inception V3模型中训练，得到一个可区分多种皮肤病的鉴别模型，将含有大量噪音标签的皮肤病图像数据集作为测试集，用此模型进行测试，模型可对这些具有噪音标签的图像进行纠正。结果表明模型可纠正大部分的错误标签，并且纠正后的数据集所训练的模型对疾病的鉴别率较未纠正前有了较大的提升。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向皮肤医学数据的标签纠错方法
本专利技术涉及计算机领域和医学领域，特别是一种面向皮肤医学数据的标签纠错方法。
技术介绍
近年来，人工智能给人类带来了很多便利，使人们的生活受到多方面的影响，如智能家居、自动驾驶和人脸识别。在人工智能中，深度学习正成为一种代表性的技术，并产生了许多应用案例。在深度学习中，机器根据现有的已标记数据集，计算训练样本的各个特征，来对此进行训练和学习，并生成用于识别和分类的判别模型，产生一系列的智能行为，最简单的应用如数字人像识别，图片分类等，故为了保证准确率和效率，获取足够的标记数据是非常重要的。目前在医学领域中，深度学习技术取得了良好的效果。例如，近年来提出的基于深度学习的先天性白内障多医院协作管理平台、利用深层神经网络设计达到皮肤科医生级别的皮肤癌分类等等。在临床上，一些皮肤疾病的病理特征相似，其图像不易区分，但是不同皮肤疾病的治疗方案差异大，所以正确的诊断十分重要。把深度学习技术应用于皮肤医学中，就需要高质量的皮肤医学数据标签。然而，在对皮肤医学数据进行处理中，我们会遇到很多的困难。一方面，对于大型数据集来说，人工处理数据是一项费时费力的工作，而且在许多系统中，标签存在噪音的问题。另一方面，在医院中，疾病数据的标签需要大量专业医生的参与，不同的医生可能会对疾病数据有不同的见解，这同样也会产生噪音标签。因此，在基于深度学习的皮肤医学数据处理领域，标签的纠错已成为非常重要的问题。目前在数据处理领域中，人工处理还是其主力。但在标签纠错中，研究人员提出了一些解决方案。例如，近年来提出了两种校正标签噪声的算法：自我训练校正和基于群...

【技术保护点】
1.一种面向皮肤医学数据的标签纠错方法，其特征在于，包括以下步骤：1)使用迁移学习方法将种子数据集加载到GoogleNet:inception V3模型上进行训练，对种子数据集中的各种特征进行学习与计算，得到相对应皮肤疾病的诊断模型；2)用步骤2)的模型对含有噪音标签的数据集中的所有图像进行测试，总共有N张图像，得到每张图像的置信度；3)对所有图像的置信度进行降序排序，选择置信度排名在前K的图像，选择原有标签与模型诊断标签一致的图像，将这些图像标识为具有正确标签的图像；选择原有标签与模型诊断标签不一致的图像，并将其标识为错误标签的图像，然后对该图像的标签进行纠正；将纠正后的图像与标签正确的图像添加到增量数据集中，并从原来含有噪音标签的数据集中移除这两部分图像；4)将种子数据集与增量数据集合并为新的种子数据集，判断含有噪音标签的数据集中是否还有图像，若有，返回执行步骤1)；若没有，则结束。

【技术特征摘要】
1.一种面向皮肤医学数据的标签纠错方法，其特征在于，包括以下步骤：1)使用迁移学习方法将种子数据集加载到GoogleNet:inceptionV3模型上进行训练，对种子数据集中的各种特征进行学习与计算，得到相对应皮肤疾病的诊断模型；2)用步骤2)的模型对含有噪音标签的数据集中的所有图像进行测试，总共有N张图像，得到每张图像的置信度；3)对所有图像的置信度进行降序排序，选择置信度排名在前K的图像，选择原有标签与模型诊断标签一致的图像，将这些图像标识为具有正确标签的图像；选择原有标签与...

【专利技术属性】
技术研发人员：曹瑞，郭克华，
申请(专利权)人：中南大学，
类型：发明
国别省市：湖南,43

全部详细技术资料下载我是这个专利的主人