一种基于非监督学习技术的害虫图像特征学习与自动分类方法技术

技术编号:13180943 阅读:74 留言:0更新日期:2016-05-11 12:53
本发明专利技术涉及一种基于非监督学习技术的害虫图像特征学习与自动分类方法,与现有技术相比解决了对害虫图像因遮挡和污染导致害虫识别能力差的缺陷。本发明专利技术包括以下步骤:进行大规模害虫图像块随机采样;害虫图像的非监督特征字典学习;害虫图像特征编码并进行特征池化操作;多类分类器识别。本发明专利技术提高了害虫识别的准确率,利用非监督的字典训练方式构造非监督字典,结合稀疏编码的方式并对特征进行池化操作,实现了特征较强的鉴别力,有效地表示了害虫图像。

【技术实现步骤摘要】

本专利技术涉及图像识别
,具体来说是一种基于非监督学习技术的害虫图像 特征学习与自动分类方法。
技术介绍
随着精准农业的兴起,计算机图像处理技术为农业生产提供了新思路,为实现害 虫图像的自动识别提供了先进的技术手段。由于其具有准确性高、速度快、信息量大等优 点,在农作物害虫识别方面得到较多的应用,可以高效地识别农作物虫害,科学管理农作物 生长,提高农作物产量和质量。然而实际农田环境复杂,害虫种类多样,所拍摄的害虫图像 容易广生遮挡或污染,对提尚识别率有一定的限制。稀疏表不的方法对遮挡和像素污染等 均具有鲁棒性,而稀疏表示的前提是训练出较好的保存特征原子的完备字典,因此如何更 优地进行特征学习并对特征进行有效表示已经成为亟待解决的问题。
技术实现思路
本专利技术的目的是为了解决现有技术中对害虫图像因遮挡和污染导致害虫识别能 力差的缺陷,提供来解决上 述问题。 为了实现上述目的,本专利技术的技术方案如下: -种基于非监督学习技术的害虫图像特征学习与自动分类方法,包括以下步骤: 进行大规模害虫图像块随机采样,对图像进行随机抽样,将该抽样过程在所有的 训练样本图像上执行,进行大规模的图像块采集;害虫图像的非监督特征字典学习,使用非监督学习方法构建特征字典0=eRnXM,其中Μ表示字典的大小,每一列山表示字典的原子; 害虫图像特征编码并进行特征池化操作,利用非监督字典DT,将害虫图像块向量yi 编码成为特征向量Xl;将特征转化为保存重要信息而丢弃不相干信息的特征; 多类分类器识别,通过多类分类器对正负特征进行训练学习,实现训练样本害虫 所属类别的判定。 所述的进行大规模害虫图像块随机采样包括以下步骤: 采集训练害虫图像视频帧,对每帧的害虫图像进行划分区块,在其中一个区块进 行随机抽样,在区块内抽样rXr的图像块,其中n = rXr,n为非监督字典的维数,在区块矩 阵范围内以随机数的形式产生rXr图像块的中心点坐标(X,y ),以此坐标在区块范围内抽 样边长为r的小图像块; 对帧内每个区块执行随机抽样过程,并将各个区块定义为稀疏特征进行池化操作 时所界定的池化范围; 对训练害虫图像视频所有帧均进行划分区块并进行随机抽样过程,获得原始字典 的训练样本特征,组成训练样本特征矩阵Y。 所述的害虫图像的非监督特征字典学习包括以下步骤: 初始化随机字典D,设置稀疏度k,V/eM,|4|2 =1,对原始特征归一化操作,初始化 字典表示为DWdicb,. · .,dM]ERnXM; 利用正交匹配追踪方法,固定随机字典D对输入数据Y进行稀疏表示得到稀疏向量 矩阵X, 其中输入数据Υ为抽取的训练样本特征矩阵,X表示稀疏向量矩阵,通过I Ui| |〇<k 进行系数限制; 逐列更新随机字典D,其公式如下: 其中dk表示D中第k列,4表示第k个行矢量,?表示字典的贡献矩阵; 判断误差是否满足精度要求或者是否达到指定的迭代次数,满足则结束训练,产 生非监督字典DT,不满足则继续计算稀疏向量矩阵X并更新随机字典D。 所述的害虫图像特征编码并进行特征池化操作包括以下步骤: 对害虫图像特征Y和非监督字典DT,使用正交匹配追踪方法获得编码特征1,i中 最多k项为非零项,其公式如下: 其中.? ef,xi表示第i个稀疏向量; 对每个区块p执行最大池操作,其中ρ ΕΡ,P为总的区块数,每个区块p获得汇聚特 征f= ERM; 在每个区块p内执行/, =max;^,,其中f/!;表示χ中第p块的所有稀疏特征的第j 维所有的数据,t为第j维数据的最大值。所述的多类分类器识别为将汇聚特征f加入支持向量机进行学习训练,得到特征 模板,采用以下方式进行;对于两类情况,第k类和第m类进行分类,通过求解最优化问题,其公式如下:其中C称为惩罚参数,纟f1表示非负的松弛变量,是训练错误的一个度量, ω 为超平面参数,则第k类和第m类之间的决策函数如下式:其中Xi是支持向量,<2广为对应的Lagrange乘子,bkm为分类阀值; 对于多类情况,将两类1-V-1情况应用于多类,若有s类,采用有向无环图方法,则 共有(s-1) X s/2个分类器分别进行分类,再采取竞争的方式预测分类。 还包括对测试样本进行分类,其包括以下步骤: 获取测试害虫图像视频,得到测试样本图像帧; 对测试图像帧根据非监督特征字典,获得对应的稀疏编码作为图像特征编码; 对稀疏特征进行最大池汇聚,减少特征数量,得到更具信息的特征; 结合多类分类器学习到的特征模板,对测试样本的汇聚特征进行预测,实现分类。 有益效果本专利技术的,与现有 技术相比提高了害虫识别的准确率,利用非监督的字典训练方式构造非监督字典,结合稀 疏编码的方式并对特征进行池化操作,实现了特征较强的鉴别力,有效地表示了害虫图像。【附图说明】图1为本专利技术的方法流程图; 图2为本专利技术与现有技术的识别率对比曲线图。【具体实施方式】 为使对本专利技术的结构特征及所达成的功效有更进一步的了解与认识,用以较佳的 实施例及附图配合详细的说明,说明如下:如图1所示,本专利技术所述的一种基于非监督学习技术的害虫图像特征学习与自动 分类方法,总体上采用先训练后识别的方法,先在实验室内对害虫图像进行识别训练,再在 实际应用场合进行实际分类。其包括以下步骤: 第一步,进行大规模害虫图像块随机采样,以能够学习一个包含害虫图像特征的 字典。对图像进行随机抽样,将该抽样过程在所有的训练样本图像上执行,进行大规模的图 像块采集,其包括以下步骤: (1)采集训练害虫图像视频帧,此害虫图像视频帧为训练样本。对每帧的害虫图像 进行划分区块,将一帧图像划分成若干个区块,在其中一个区块进行随机抽样。随机抽样的 过程为在区块内抽样rXr的图像块,rXr的图像块尽量为小图像块,其中n = rXr,n为后续 步骤中的非监督字典的维数。在区块矩阵范围内按现有技术的方法以随机数的形式产生r Xr图像块的中心点坐标(x,y),以此坐标在区块范围内抽样边长为r的小图像块,最佳的方 式是将r X r的图像块在区块的中心点处抽取,这样便于计算出中心点坐标(X,y ),也便于计 算出抽样边长r。 (2)对帧内每个区块执行随机抽样过程,即进行上一步骤的抽样过程。并将各个区 块定义在后续池化操作过程中对所有的稀疏特征进行池化操作时所界定的池化范围。 (3)对训练害虫图像视频所有帧均进行划分区块并进行随机抽样过程,执行以上 两步的操作,以进行大规模的图像块采集。在实际应用中,能够从样本库中抽取12万个图像 块,共抽取60类害虫图像,每类2000个图像块,以此获得原始字典的训练样本特征,组成训 练样本特征矩阵Y。 第二步,害虫图像的非监督特征字典学习,构建出一个包括多类害虫图像特征原 子的完备字典。使用非监督学习方法构建特征字典DitcU,^,. . .,dM]eRnXM,其中Μ表示字 典的大小,每一列山表示字典的原子。并采用K-SVD算法进行字典的训练过程,K-SVD算法通 过不断迭代降低残差的能量并学习更新特征字典D,不仅实现了重构误差最小且满足了稀 疏限制,特征在特征字典D下能具有较强的稀疏表示性。其包括以下步骤: (1)初始化随机字典D,设置稀疏度k,V/eM,||?f,||本文档来自技高网...

【技术保护点】
一种基于非监督学习技术的害虫图像特征学习与自动分类方法,其特征在于,包括以下步骤:11)进行大规模害虫图像块随机采样,对图像进行随机抽样,将该抽样过程在所有的训练样本图像上执行,进行大规模的图像块采集;12)害虫图像的非监督特征字典学习,使用非监督学习方法构建特征字典D=[d1,d2,...,dM]∈Rn×M,其中M表示字典的大小,每一列dj表示字典的原子;13)害虫图像特征编码并进行特征池化操作,利用非监督字典DT,将害虫图像块向量yi编码成为特征向量xi;将特征转化为保存重要信息而丢弃不相干信息的特征;14)多类分类器识别,通过多类分类器对正负特征进行训练学习,实现训练样本害虫所属类别的判定。

【技术特征摘要】

【专利技术属性】
技术研发人员:谢成军张超凡李瑞宋良图张洁周林立陈红波刘磊
申请(专利权)人:中国科学院合肥物质科学研究院
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1