当前位置: 首页 > 专利查询>中山大学专利>正文

一种人类上皮细胞样本图像自动分类方法技术

技术编号:19122700 阅读:39 留言:0更新日期:2018-10-10 05:30
本发明专利技术公开了一种人类上皮细胞样本图像自动分类方法,包括步骤:将人类上皮细胞样本图像分割成多张细胞群图片;从细胞群图片中筛选出有效的训练样本;使用有效的训练样本对深度卷积神经网络进行训练;用训练完成的深度卷积神经网络对未筛选的细胞群图片进行模式分类;统计模式分类结果,得到每个人类上皮细胞样本图片的模式分布直方图;使用模式分布直方图作为特征向量,输入到统计分类器进行模型训练;使用训练好的统计分类器对测试样品进行分类预测。本发明专利技术使用深度卷积神经网络,对单个细胞进行模式识别,具有鲁棒性;使用模式分布直方图作为样本图像的特征表达,对噪声数据有一定的容忍度,识别率高。

【技术实现步骤摘要】
一种人类上皮细胞样本图像自动分类方法
本专利技术涉及计算机视觉和医学图像处理领域,尤其涉及一种人类上皮细胞样本图像自动分类方法。
技术介绍
近五年来,计算机视觉、模式识别技术被逐渐应用在医学辅助诊断,医学图像处理和分析已经成为了一个热门的研究和应用领域。人类上皮细胞(HEp-2)的模式识别有助于医生诊断出病人的免疫疾病。在医学领域,该识别过程往往由经验丰富的医生来完成,人工成本昂贵,人工识别率不高(75%左右)。不同医生对同一样本还可能做出不同的诊断。近三年来出现了很多自动识别人类上皮细胞(HEp-2)的方法,如使用局部描述子,如HOG、SIFT、LBP,再配合特征编码,如稀疏编码、FisherVector。但是关于识别整个样本的研究工作却比较少,常用的方法也是通过局部描述子配合特征编码的方式。而目前的深度学习技术,从未被用于该分类任务当中。
技术实现思路
为克服现有技术的不足,提供一种本专利技术提出实用性强、样本识别率高的方法,本专利技术提出一种使用深度卷积神经对样本内的细胞进行模式识别,并统计样本内的模式分布,并且将模式分布直方图作为样本的特征表达来将人类上皮细胞样本图像自动分类方法。本专利技术的技术方案是这样的:一种人类上皮细胞样本图像自动分类方法,包括步骤S1:将人类上皮细胞样本图像分割成多张细胞群图片;S2:从所述细胞群图片中筛选出有效的训练样本;S3:使用有效的训练样本对深度卷积神经网络进行训练;S4:用训练完成的深度卷积神经网络对未筛选的细胞群图片进行模式分类;S5:统计模式分类结果,得到每个人类上皮细胞样本图片的模式分布直方图;S6:使用所述模式分布直方图作为特征向量,输入到统计分类器进行模型训练;S7:使用训练好的统计分类器对测试样品进行分类预测。进一步地,步骤S2包括步骤S21:将每一张人类上皮细胞样本图像分割成细胞区域和背景两个部分;S22:通过检测非连通区域,得到单个细胞所在的区域;S23:对每个区域求球心,用一定大小的矩阵框住细胞区域,并求出该张人类上皮细胞样本图像中的细胞中心向量及每个细胞到中心向量的欧式距离;S24:通过筛选欧式距离,筛选出相对有效的训练样本。进一步地,步骤S6中所述统计分类器为支持向量机或随机森林。本专利技术的有益效果在于,与现有技术相比,本专利技术使用自动分割算法分割出细胞,方便快捷,并且使用筛选准则,保证了训练样本的有效性,在一定程度上过滤了噪声数据;本专利技术使用深度卷积神经网络,在利用有效样本训练的基础上,对单个细胞进行模式识别,具有鲁棒性;本专利技术使用模式分布直方图作为样本图像的特征表达,对噪声数据有一定的容忍度,识别率高。附图说明图1是本专利技术一种人类上皮细胞样本图像自动分类方法流程图;图2是本专利技术中一个实施例中应用到的ICPR-2013数据集示例图;图3是本专利技术一个实施例中所使用的深度卷积神经网络的结构图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参见图1,本专利技术一种人类上皮细胞样本图像自动分类方法包括步骤S1:将样本图片自动分割成多张细胞群图片。S2:筛选出有效训练样本。具体地,在本实施例中,采用76×76的方框将单个细胞框住。接着,使用特征描述子对其进行特征提取。假设N张图片得到的特征向量为{x1,x2,x3,…,xN},那么一个样本内的细胞中心向量可以估计为接着计算出每个细胞到中心向量的欧式距离通过筛选欧式距离即可筛选出相对有效的训练样本。在本实施例中,我们筛选出90%的有效样本。S3:利用有效训练样本对深度卷积神经网络进行训练。在本实施例中,所有单细胞图片被缩放到60×60,接着使用图3的网络进行训练。考虑到计算时间和避免过拟合,训练的次数设定为50,每次批量训练的样本数设定为200。由于各类的训练样本不均衡,实施例中还使用了样本增广技术。S4:用完成训练的网络对同一样本的多张细胞图片进行模式分类。S5:统计模式分类结果,得到每个人类上皮细胞样本图片的模式分布直方图。S6:使用所述模式分布直方图作为特征向量,输入到统计分类器进行模型训练。在本实施例中,使用了线性支持向量机作为分类模型,C的值设定为100,模型训练时间比较短。S7:使用训练好的统计分类器对测试样品进行分类预测。本专利技术通过以下实验对本专利技术的效果进行说明:训练和识别测试在公开数据库ICPR-2013上进行,ICPR-2013数据集示例如图2所示。该数据库共有252个病人。我们使用“留一法”来检验算法的有效性。在模型训练阶段,每次抽取251个病人的样本作为训练数据,剩下的一个病人的样本作为测试数据。经过252次操作后,可以得到每个病人的样本识别率。在“留一法”的评价标准下,该算法在ICPR2013数据集的识别率混淆矩阵,如表1所示:表1以上所述是本专利技术的优选实施方式,应当指出,对于本
的普通技术人员来说,在不脱离本专利技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本专利技术的保护范围。本文档来自技高网
...
一种人类上皮细胞样本图像自动分类方法

【技术保护点】
1.一种人类上皮细胞样本图像自动分类方法,其特征在于,包括步骤S1:将人类上皮细胞样本图像分割成多张细胞群图片;S2:从所述细胞群图片中筛选出有效的训练样本;S3:使用有效的训练样本对深度卷积神经网络进行训练;S4:用训练完成的深度卷积神经网络对未筛选的细胞群图片进行模式分类;S5:统计模式分类结果,得到每个人类上皮细胞样本图片的模式分布直方图;S6:使用所述模式分布直方图作为特征向量,输入到统计分类器进行模型训练;S7:使用训练好的统计分类器对测试样品进行分类预测。

【技术特征摘要】
1.一种人类上皮细胞样本图像自动分类方法,其特征在于,包括步骤S1:将人类上皮细胞样本图像分割成多张细胞群图片;S2:从所述细胞群图片中筛选出有效的训练样本;S3:使用有效的训练样本对深度卷积神经网络进行训练;S4:用训练完成的深度卷积神经网络对未筛选的细胞群图片进行模式分类;S5:统计模式分类结果,得到每个人类上皮细胞样本图片的模式分布直方图;S6:使用所述模式分布直方图作为特征向量,输入到统计分类器进行模型训练;S7:使用训练好的统计分类器对测试样品进行分类预测。2.如权利要求1...

【专利技术属性】
技术研发人员:郑伟诗李宏伟黄灏李瑞溪
申请(专利权)人:中山大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1