一种基于词袋模型和纹理特征的细胞光谱图像分类方法技术

技术编号:24458613 阅读:34 留言:0更新日期:2020-06-10 16:18
一种基于词袋模型和纹理特征的细胞光谱图像分类方法,它涉及运用特征提取技术进行细胞光谱图像分类,可用于医学上计算机辅助诊断系统中,提高临床及实验诊断效率和准确率。本发明专利技术的步骤为:一、利用显微高光谱成像系统拍摄样本细胞光谱图像;二、对细胞光谱图像进行纹理特征提取和词袋模型计算;三、将得到的词袋纹理特征向量输入加权型SVM多分类模型进行训练,优化分类器参数,并用测试集得出分类精度。本发明专利技术的基本思想是不仅运用细胞图像的空间信息,还运用其光谱信息,并在特征提取时将词袋模型和纹理特征融合对细胞图像进行分类,可有效提高细胞图像的分类精度。

A cell spectral image classification method based on word bag model and texture features

【技术实现步骤摘要】
一种基于词袋模型和纹理特征的细胞光谱图像分类方法
本专利技术涉及计算机视觉领域的图像分类方法,具体涉及一种基于词袋模型和纹理特征的细胞光谱图像分类方法。
技术介绍
细胞图像的特征提取和分类识别在辅助疾病诊断时有关键作用,计算机辅助诊断系统提供的特征描述和分类结果为医生的临床诊断提供了客观依据,可以提高诊断的准确率和效率,降低了人力成本,而且有效减少了因主观诊断经验造成的误诊现象。本专利技术使用的样本细胞图像由实验室自组的显微高光谱成像系统拍摄,样本细胞包括:椴树茎横切细胞、蚕豆叶下表皮细胞、洋葱表皮细胞、蜜蜂翅细胞和松花粉细胞。显微高光谱成像系统拍摄的图像不仅包含细胞的二维空间信息,还包含反映细胞特性的一维光谱信息,将二者结合成为一个三维的数据立方体,这样有助于特征提取和区分细胞类别。词袋模型是自然语言处理和信息检索领域的常用技术,它将一系列文本看作由许多独立的词汇构成,组成这些文本的词汇形成词典,一个文本中词典词汇出现的次数构成一个数值向量,这个向量就可以代表该文本进行分类。相应的,在计算机视觉领域,视觉词袋模型也成为了一种常用的图像表示方法。首先,对图像进行局部特征提取;然后,对这些局部特征进行聚类形成视觉词典;最后,统计一幅图像中所有视觉词汇出现的次数代表这幅图像。本专利技术使用SIFT(Scale-invariantfeaturetransform,SIFT)具有尺度、旋转不变性的图像局部描述性算子提取图像的局部特征作为视觉单词,之后使用K-means聚类方法构建视觉词典。在对样本细胞拍摄时发现不同样本细胞的纹理特征有较大区别,纹理特征是一种全局特征,纹理是一种物体表面的特性,是对局部区域像素之间关系的一种度量,是描述识别物体的一种重要特征。细胞图像的纹理特征描述了图像中反复出现的局部规律和像素排列规则,反映了宏观意义上灰度变化的规律。纹理特征提取方法主要有:统计方法、几何法、模型法、信号处理法和结构方法。统计方法的典型代表是灰度共生矩阵的纹理特征分析方法,Haralick等人定义了用于描述纹理特征的14个灰度共生矩阵特征参数,Ulaby等人发现这14个参数中只有4个是不相关的即二阶矩、对比度、相关性和熵,本专利技术将相关性进行扩展并融入到SVM(SupportVectorMachine,SVM)核函数中形成加权核函数,此外补充一个逆差矩特征参数用于纹理分析,将词袋模型提取的图像特征和纹理分析得到的特征参数融合,有效提高了细胞图像分类精度。
技术实现思路
目前,病理诊断仍然是医生诊断疾病的主要方式,但是诊断结果的准确率依靠着医生的经验,需要长期的学习和培训,有很高的人力和物力成本。随着图像识别、深度学习等技术的飞速发展,计算机辅助诊断系统为医生临床诊断提供了可靠的客观依据,有效提高了诊断准确率。本专利技术将显微成像和光谱成像技术结合起来,用到的样本细胞图像既包含细胞的空间信息,也包含了细胞在不同波长下的信息,提高了细胞图像分类的准确度。将拍摄的细胞图像实时上传工作站(通过无线或有线形式,如Wi-Fi、以太网网线等),利用细胞光谱图像分类程序进行分类。本专利技术的目的是通过以下技术方案实现的:首先,利用显微高光谱成像系统拍摄样本细胞,并对细胞光谱图像进行分割和直方图均衡化,提高图像对比度;其次分别计算图像的灰度共生矩阵和SIFT特征,得出图像的纹理特征向量和词袋模型后,将二者融合得到词袋纹理特征向量代表该细胞光谱图像;然后将拍摄的细胞光谱图像分为训练集和测试集,利用加权型SVM分类器对训练集进行训练,得到加权型SVM分类器模型并对测试集进行分类,得出细胞光谱图像的分类精度。本专利技术的流程图如图1所示,具体步骤如下:步骤一:利用由显微镜、液晶可调谐滤光片(liquidcrystaltunablefilter,LCTF)、智能相机和计算机组成的显微高光谱成像系统拍摄样本细胞,基于LCTF的光谱成像系统成像快、光强分布均匀、杂散光少,更适于目标探测采集用,方便医学图像方面的光谱数据采集。智能相机采用CMOS图像传感器(CCD传感器的形式也可以更换采用),而且相机自身为嵌入式系统,可执行图片预处理及分析功能,拍摄得到的图像包含了细胞在不同波长下的信息,本专利技术采用的显微高光谱成像系统光谱范围为可见光波段,显微镜目镜和物镜倍数均可根据拍摄样本大小调节,由于拍摄的细胞图像有很大部分黑色背景区域,影响程序运行效率,选择一个合理的亮度阈值对图像进行分割,去除背景。步骤二:将经过分割的样本细胞光谱图像分别计算纹理特征参数向量和词袋模型,之后将二者融合,得到的词袋纹理特征向量代表该细胞光谱图像。根据样本细胞光谱图像得到灰度共生矩阵,计算出二阶矩、对比度、熵和逆差矩特征参数,具体步骤如下:步骤2-1-1:灰度共生矩阵定义为从灰度为n的像素点到灰度为m的像素点的概率,d是起点为n终点为m的向量d=(Dx,Dy),θ代表d的方向,灰度共生矩阵用P(n,m)(n,m=0,1,2,...,L-1)表示,L表示图像的灰度级(如图2所示)。细胞光谱图像有256个灰度级,对于计算灰度共生矩阵来说,灰度级过多。为减少计算量,提高效率,进行灰度级数压缩。步骤2-1-2:利用直方图均衡化技术处理图像,提高图像对比度,得到一幅拓展了动态范围的图像。步骤2-1-3:计算灰度共生矩阵,由于我们需要提取图像的纹理特征,通常取不同方向的d,取求得的特征参数均值作为一幅图像的纹理特征参数向量,这样就使得求出的特征参数与方向无关。步骤2-1-4:分别求4个方向灰度共生矩阵的特征参数。二阶矩反映图像灰度的均匀程度和纹理粗细度,其计算公式为:对比度反映图像的清晰度和纹理沟纹深浅的程度,其计算公式为:其中t=|n-m|。熵反映图像所具有的信息量,其计算公式为:逆差矩反映图像纹理局部变化的多少,其计算公式为:步骤2-1-5:分别求特征参数的均值,例如二阶矩特征参数计算公式:其中E0°,E45°,E90°,E135°,分别代表θ为0°,45°,90°,135°时灰度共生矩阵的二阶矩,另外3个特征值计算方法相同,计算出的特征参数组成一个的纹理特征参数向量t:t=[EmeanCmeanEnmeanDmean](6)代表该幅细胞光谱图像。将词袋模型运用到细胞光谱图像的分类上,具体步骤如下:步骤2-2-1:对细胞光谱图像逐波段进行均匀分割,分割出Q个区域,每个区域经过局部特征提取,一共可以提取出Q个视觉词汇。步骤2-2-2:对图像的Q个区域进行SIFT特征提取,每个区域提取一个128维的特征向量作为该区域的视觉词汇。步骤2-2-3:对所有样本细胞图像提取出的SIFT特征向量进行K-means聚类,得到k个聚类中心即视觉词典。步骤2-2-4:根据得到的视觉词典,计算一幅图的视觉词汇(SIFT向量)到词典中词汇的距离,距离词典中视觉词汇最近的词汇归到该词典类,统计结果形成一个k维向量,称为该图像的词袋模型。本文档来自技高网
...

【技术保护点】
1.一种基于词袋模型和纹理特征的细胞光谱图像分类方法,其特征在于它包括以下步骤:/n步骤一:利用实验室自组的显微高光谱成像系统拍摄样本细胞,拍摄得到的图像包含了细胞在不同波长下的信息,拍摄的细胞图像有很大部分黑色背景区域,选择一个合理的亮度阈值对图像进行分割,去除背景;/n步骤二:将经过分割的样本细胞光谱图像分别计算纹理特征参数向量和词袋模型,根据样本细胞光谱图像得到灰度共生矩阵,计算出二阶矩E、对比度C、熵En和逆差矩D特征参数,之后将纹理特征向量和词袋模型融合,得到的词袋纹理特征向量代表该细胞光谱图像;/n步骤三:计算纹理相似性系数得到加权核函数,将数据集分为训练集和测试集,将训练集中细胞光谱图像的词袋纹理特征向量输入加权型SVM多分类器进行训练,优化分类器参数,得到SVM分类器模型,将测试集输入到SVM分类器中进行分类,得到细胞光谱图像分类精度。/n

【技术特征摘要】
1.一种基于词袋模型和纹理特征的细胞光谱图像分类方法,其特征在于它包括以下步骤:
步骤一:利用实验室自组的显微高光谱成像系统拍摄样本细胞,拍摄得到的图像包含了细胞在不同波长下的信息,拍摄的细胞图像有很大部分黑色背景区域,选择一个合理的亮度阈值对图像进行分割,去除背景;
步骤二:将经过分割的样本细胞光谱图像分别计算纹理特征参数向量和词袋模型,根据样本细胞光谱图像得到灰度共生矩阵,计算出二阶矩E、对比度C、熵En和逆差矩D特征参数,之后将纹理特征向量和词袋模型融合,得到的词袋纹理特征向量代表该细胞光谱图像;
步骤三:计算纹理相似性系数得到加权核函数,将数据集分为训练集和测试集,将训练集中细胞光谱图像的词袋纹理特征向量输入加权型SVM多分类器进行训练,优化分类器参数,得到SVM分类器模型,将测试集输入到SVM分类器中进行分类,得到细胞光谱图像分类精度。


2.根据权利要求1所述的词袋模型和纹理特征的细胞光谱图像分类方法,其特征在于所述的步骤一具体包括:
利用由显微镜、LCTF、智能相机和计算机组成的显微高光谱成像系统拍摄5类样本细胞,基于液晶可调谐滤光片的光谱成像系统成像快、光强分布均匀、杂散光少,更适于目标探测采集用,方便医学图像方面的光谱数据采集,智能相机采用CMOS图像传感器,而且相机自身为嵌入式系统,可执行图片预处理及分析功能,拍摄得到的图像包含了细胞在不同波长下的信息,显微高光谱成像系统光谱范围为可见光波段,显微镜目镜和物镜倍数均可根据拍摄样本大小调节,由于拍摄的细胞图像有很大部分黑色背景区域,影响程序运行效率,选择一个合理的亮度阈值对图像进行分割,去除背景。


3.根据权利要求1所述的词袋模型和纹理特征的细胞光谱图像分类方法,其特征在于所述的步骤二具体包括:
根据样本细胞光谱图像得到灰度共生矩阵,计算出二阶矩、对比度、熵和逆差矩特征参数,具体步骤如下:
步骤2-1-1:初始细胞光谱图像灰度级较多,为提高效率进行灰度级压缩;
步骤2-1-2:运用直方图均衡化技术处理图像,提高亮度和对比度;
步骤2-1-3:根据样本细胞光谱图像得到4个方向上的灰度共生矩阵;
步骤2-1-4:计算二阶矩E、对比度C、熵En和逆差矩个特征参数:












其中P(n,m)表示灰度共生矩阵n行m列的值;
步骤2-1-5:分别求特征参数的均值,例如二阶矩特征参数计算公式:



其中E0°,E45°,E90°,E135°,分别代表θ为0°,45°,90°,135°时的二阶矩,另外4个特征值计算方法相同,计算出的特征参数组成一个纹理特征参数向量t:
t=[EmeanCmeanEnmeanDmean]
代表该幅细胞光谱图像。


4.根据权利要求1所述的词袋模型和纹理特征的细胞光谱图像分类方法,其特征在于所述的步骤二具体包括:
将词袋模型运用到细胞光谱图像的分类上,具体步骤如下:
步骤2-2-1:对细胞光谱图像逐波段进行均匀分割,分割出Q个区域,每个区域经过局部特征提取,一共可以提取出Q个视觉词汇;
步骤2-2-2:对图像的Q个区域进行SIFT特...

【专利技术属性】
技术研发人员:张淼鲁一帆牛思聪冯迦炆沈毅
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:黑龙;23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1