一种基于深度级联森林和高光谱图像的玉米品种鉴别方法技术

技术编号:21829958 阅读:21 留言:0更新日期:2019-08-10 17:03
本发明专利技术提供了一种基于深度级联森林和高光谱图像的玉米品种鉴别方法,包括:对所述玉米影像数据进行预处理,得到全波段影像数据;选取有效波段的玉米影像数据;以及将所述有效波段的玉米影像数据作为特征集,采用深度级联森林模型进行模型分类。本发明专利技术的玉米品种鉴别方法充分利用高光谱技术和深度级联森林模型进行玉米分类,相较于普通的机器学习算法,鉴别精度更高。

A Maize Variety Identification Method Based on Deep Cascade Forest and Hyperspectral Images

【技术实现步骤摘要】
一种基于深度级联森林和高光谱图像的玉米品种鉴别方法
本专利技术涉及玉米品种的鉴别方法,尤其涉及一种基于深度级联森林和高光谱图像的玉米品种鉴别方法。
技术介绍
玉米是我国重要的粮食作物之一,占粮食总产量的30%以上,制种量年均超过10亿吨。随着玉米需求多样化,我国玉米品种也逐年增多。在育种过程中,有不法商贩以次充好,使用劣质玉米品种冒充优质玉米品种,导致玉米产量下降,给国家粮食生产和农业安全带来巨大隐患,因此如何准确高效无损地鉴别玉米种子的品种具有重要意义。目前鉴别玉米种子的方法主要有人工检测、理化检测、计算机视觉检测和高光谱技术检测。人工检测主要靠肉眼基于玉米的大小、形态和颜色等特征做出判断,这种方式受人的主观因素影响很大,不仅检测精度低、速度慢,而且劳动强度大,难以形成统一的标准。理化检测主要是基于不同品种玉米的生物化学特性来实现鉴别,这类方法准确率高,但是只能够通过抽样进行检测,有损且过程复杂,操作繁琐,难以满足市场需求。计算机视觉检测主要基于种子的近红外光谱信息和可见光的形态学特征信息,应用图像模式识别技术建立品种判别模型,具有即时、高效、无损和准确的优点;但该类方法提取的特征信息较少,而且大多是基于外部特征的评价,无法获取表征其内部成分的特征,检测结果可靠性受到影响;另外,随着种子品种数据增多,种子特征的交叉现象严重,导致模型的可分性变差。高光谱技术是集光谱和图像于一体的技术,相比于机器视觉技术和近红外光谱分析技术而言,高光谱技术不仅能获取对象的图像信息,而且能获取光谱信息,可以有效地表征观测对象的内部结构特征和化学成分特征;此外,高光谱技术以其快速、无损的技术优点有效地解决了农产品检测领域操作繁琐的难题,在农产品无损检测方面的应用日趋广泛。
技术实现思路
针对以上方法的缺陷,本专利技术提出了一种基于深度级联森林和高光谱图像的玉米品种鉴别方法,为高光谱图像在玉米品种自动识别领域提供理论依据。本专利技术的一种基于深度级联森林和高光谱图像的玉米品种鉴别方法,包括:步骤1:对玉米影像数据进行预处理,得到全波段影像数据;步骤2:选取有效波段的玉米影像数据;以及步骤3:将有效波段的玉米影像数据作为特征集,采用深度级联森林模型进行模型分类。在上述玉米品种鉴别方法中,步骤1包括:通过高光谱图像采集系统采集玉米影像数据;对玉米影像数据进行校正;提取玉米的感兴趣区域(ROI)影像数据;以及对提取的玉米的感兴趣区域影像数据进行光谱校正,得到全波段影像数据。在上述玉米品种鉴别方法中,通过高光谱图像采集系统来采集玉米影像数据,且只保留在波段范围533-893.4nm内等间距选择的146个波段的玉米影像数据;采用校正公式对玉米影像数据进行校正,校正公式为:采用基于距离变换的标记分水岭分割算法提取每个玉米的感兴趣区域(ROI)影像数据;采用Savitzky-Golay平滑(S-G平滑)算法对提取的玉米感兴趣区域(ROI)影像数据进行光谱校正。在上述玉米品种鉴别方法中,采用Boruta算法对全波段影像进行筛选,选出其中的有效波段影像。在上述玉米品种鉴别方法中,Boruta算法的过程如下:为每个特征构建影子特征混入训练集,并去除这些特征与类别的关联;在混入影子特征的训练集上训练随机森林分类器;利用特征的平均损失和标准偏差计算Z-score;删除那些Z-score比影子特征差的特征;以及当所有特征被确认或者算法达到设置的迭代次数时,算法停止。在上述玉米品种鉴别方法中,深度级联森林模型包含两个阶段:多粒度扫描和级联森林阶段。在上述玉米品种鉴别方法中,级联森林的每一层结构由均由500棵决策树组成的四个随机森林组成,其中四个随机森林包括两个完全随机森林和两个普通随机森林,其中,前两个代表完全随机森林,剩余两个代表普通随机森林,然后通过gini分裂筛选分裂节点。在级联森林阶段中,每层的四个随机森林都采用了k折交叉验证方法,当级联森林中的一层完成训练后,用此模型来对一个检验集进行预测,如果当前层的准确率比前一层的准确率高,则继续构造级联森林的下一层,直至当前层对检验集的准确率较前一层的准确率不再提升,训练就会终止,模型因此而确定。在上述玉米品种鉴别方法中,多粒度扫描采用不同尺寸的滑动窗口在玉米影像上做滑动,得到原始特征信息。在上述玉米品种鉴别方法中,采用7、9和11三种尺度的窗口在玉米影像上做滑动,分类是三类。在上述玉米品种鉴别方法中,窗口7将会生成19个7×7的训练子影像,这些数据输入一个完全随机森林和一个普通随机森林训练,每个子影像生成一个3维的分类可能性向量,级联之后生成一个114维的特征向量,窗口9将会得到108维的特征向量,窗口11将会得到102维的特征向量,114维的特征向量训练第一级的级联森林,108维的特征向量训练第二级的级联森林,102维的特征向量训练第三级的级联森林,重复这一过程,直至检验集上精度收敛,取级联森林的最后一层的可能性向量的类别平均值,之后取最大值作为最终的预测结果。本专利技术提供了一种基于深度级联森林和高光谱图像的玉米品种鉴别方法,充分利用高光谱技术和深度级联森林模型进行玉米分类,相较于普通的机器学习算法,鉴别精度更高。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。图1是根据本专利技术的一种基于深度级联森林和高光谱图像的玉米品种鉴别方法的技术流程图。图2a是深度级联森林模型玉米分类模型中的级联森林;图2b是深度级联森林模型玉米分类模型中的多粒度扫描级联森林。图3为玉米品种样本。图4是玉米感兴趣区域(ROI)提取过程。图5是玉米分类结果。图6是深度级联森林模型分类结果。图7是深度级联森林在不同参数下的分类结果。具体实施方式本专利技术提供了一种基于深度级联森林和高光谱图像的玉米品种鉴别方法,包括:对玉米影像数据进行预处理,得到全波段影像数据;选取有效波段的玉米影像数据;以及将有效波段的玉米影像数据作为特征集,采用深度级联森林模型进行模型分类。本专利技术提供的一种基于深度级联森林和高光谱图像的玉米品种鉴别方法的技术流程如图1所示,主要包括三部分:数据预处理;有效波段选择;模型分类。1.1数据预处理1.1.1玉米影像采集采用高光谱图像采集系统采集玉米影像数据,其中高光谱图像采集系统由光源、移动平台和采集单元组成。图像采集单元包括图像光谱仪、电荷耦合器件(CCD)探测器(1392×1040的面阵CCD相机)和镜头(F/2.4,MCT,C-mount)。高光谱图像光谱系统的狭缝宽度为30μm,光谱范围为400~1000nm,光谱分辨率为2.8nm。由于数据采集过程中存在信号噪声,为保证玉米影像数据质量,只保留波段范围533.1-893.4nm的146个波段的玉米影像数据,其中,该146个波段是在波段范围533.1-893.4nm内等间距选择的。1.1.2玉米影像校正由于光源光照强度分布不均匀,加之暗电流的影响,影像会存在很多噪声,因此需要进行校正以减弱或消除噪声的干扰,校正公式为:其中,IS为原始高光谱影像,ID为黑板标定影像,IW为白板标定影像,R为校正后的高光谱影像。1.1.3玉米感兴趣区域(ROI)影像提取在提取每个玉米的光谱信息和纹理信息之本文档来自技高网
...

【技术保护点】
1.一种基于深度级联森林和高光谱图像的玉米品种鉴别方法,其特征在于,包括以下步骤:步骤1:对玉米影像数据进行预处理,得到全波段影像数据;步骤2:选取有效波段的玉米影像数据;以及步骤3:将所述有效波段的玉米影像数据作为特征集,采用深度级联森林模型进行模型分类。

【技术特征摘要】
1.一种基于深度级联森林和高光谱图像的玉米品种鉴别方法,其特征在于,包括以下步骤:步骤1:对玉米影像数据进行预处理,得到全波段影像数据;步骤2:选取有效波段的玉米影像数据;以及步骤3:将所述有效波段的玉米影像数据作为特征集,采用深度级联森林模型进行模型分类。2.根据权利要求1所述的玉米品种鉴别方法,其特征在于,其中,所述步骤1包括:通过高光谱图像采集系统采集玉米影像数据;对所述玉米影像数据进行校正;提取玉米的感兴趣区域(ROI)影像数据;以及对提取的所述玉米的感兴趣区域影像数据进行光谱校正,得到所述全波段影像数据。3.根据权利要求2所述的玉米品种鉴别方法,其特征在于,其中,通过高光谱图像采集系统来采集玉米影像数据,且只保留在波段范围533-893.4nm内等间距选择的146个波段的玉米影像数据;采用校正公式对所述玉米影像数据进行校正,所述校正公式为:采用基于距离变换的标记分水岭分割算法提取每个玉米的感兴趣区域(ROI)影像数据;采用Savitzky-Golay平滑(S-G平滑)算法对提取的所述玉米感兴趣区域(ROI)影像数据进行光谱校正。4.根据权利要求1所述的玉米品种鉴别方法,其特征在于,采用Boruta算法对全波段影像数据进行筛选,选出其中的有效波段影像数据。5.根据权利要求4所述的玉米品种鉴别方法,其特征在于,所述Boruta算法的过程如下:为每个特征构建影子特征混入训练集,并去除这些特征与类别的关联;在混入影子特征的训练集上训练随机森林分类器;利用特征的平均损失和标准偏差计算Z-score;删除Z-score比影子特征差的特征;以及当所有特征被确认或者算法达到设置的迭代次数时,算法停止。6.根据权利要求1...

【专利技术属性】
技术研发人员:陈云浩邵琦李京
申请(专利权)人:北京师范大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1