一种基于机器学习的花朵种类识别方法技术

技术编号:22565699 阅读:20 留言:0更新日期:2019-11-16 12:17
本发明专利技术公开一种基于机器学习的花朵种类的识别方法,该方法首先从样本库中对每幅图像进行图像预处理后分割ROI区域,根据ROI区域的位置建立二维坐标系,对花朵进行四边定位,确定出花朵的矩形区域位置,对每个样本的ROI区域提取出SIFT特征,然后对每个样本的SIFT特征进行K‑means聚类,得到该样本的关键词及其权重和样本类别信息。随后,把所有样本的关键词及其权重作为输入、样本类别作为输出,来训练一个多类SVM分类器,得到一个包含所有花朵类别的种类信息的分类器,将新采集的未分类的图片输入训练好的多类SVM分类器中,即可输出对应的花朵种类信息。本发明专利技术的方法能对花朵类别进行智能识别,识别更快、更方便、识别率更高。

A flower species recognition method based on machine learning

The invention discloses a kind of flower recognition method based on machine learning. The method first divides ROI region after image preprocessing for each image from sample library, establishes two-dimensional coordinate system according to the position of ROI region, positions flowers on four sides, determines the position of flower rectangle region, extracts SIFT feature from ROI region of each sample, and then extracts SIFT feature from ROI region of each sample SIFT features are clustered by K \u2011 means to get the key words, weight and category information of the sample. Then, the key words and their weights of all samples are used as input, and the sample categories are used as output to train a multi class SVM classifier, and a classifier containing the category information of all flower categories is obtained. The newly collected unclassified pictures are input into the trained multi class SVM classifier, and the corresponding flower category information is output. The method of the invention can intelligently recognize the flower category, and the recognition is faster, more convenient and the recognition rate is higher.

【技术实现步骤摘要】
一种基于机器学习的花朵种类识别方法
本专利技术涉及图像处理领域,具体涉及一种基于机器学习的花朵种类的识别方法。
技术介绍
人类的身边存在着各种各样的植物,它们是构成地球生物圈的重要组成部分;植物从诞生进化发展到现在,经历了十分漫长的岁月。地球上有着数以亿计的植物,形成了现实的生态系统,它们在维持生态系统的平衡方面发挥着巨大的作用,同时植物也是人类文明发展和延续必不可少的重要因素。因为植物对于生态系统和人类具有着如此重要的意义,对于植物进行研究就显得相当重要。但是因为不同种类的植物在经济价值、生活习性、形态构造等各个方面都表现出不同的特性,为了能够更好、更有效地保护、利用各种植物,我们需要对植物进行识别和分类。花是植物的重要组成部分之一,能充分的反应植物的特征,通过对花朵的识别可以很好的对植物进行分类。在传统的花朵识别方法中,专业人员依靠自身丰富的经验,根据花朵外部形态上的特征,去识别花的种类。但是非专业的人员很难掌握这些方法,这些方法也很难被应用于日常的生活中。地球上有着数以万计的植物,单纯的依靠人的经验和记忆是很难有效的对植物进行识别的。传统的花朵识别方法依靠人工方式进行分类,难度大,效率低。如何使人们更方便、快捷、准确的实现对花朵的辨认成为一个技术难题。
技术实现思路
针对现有技术的不足,本专利技术提出一种基于机器学习的花朵种类的识别的方法,具体技术方案如下:一种基于机器学习的花朵种类的识别方法,其特征在于,该方法具体包括如下步骤:S1:采集用于训练的包含花朵的图片;S2:对所述的花朵图片进行灰度处理和阈值处理,得到对应的二值化图像;S3:将该二值化图像中可能包含花朵的ROI区域进行分割提取出来;S4:然后根据四边定位法对ROI区域进行花朵准确定位,所述的四边定位法具体过程为:(1)先对ROI区域进行建立二维直角坐标系,根据坐标系确定ROI区域边缘点的坐标;(2)对于ROI区域的任意一边,随机选取10-20个边缘点,计算边缘点的方差值,然后忽略误差较大的1个或两个边缘点,利用线性回归对剩下的边缘点进行回归直线拟合;(3)最后对四条边均进行线性回归直线拟合,即得到包含花朵的矩形区域,从而实现对花朵的定位。S5:对于每个花朵样本,均提取定位图像的所有SIFT特征;S6:对每个定位图像提取到的所有SIFT特征进行聚类,得到生成特征的K个关键词及其权重;S7:重复S2-S6,得到所有训练的包含花朵的图片的K个关键词及其权重和样本类别;S8:将S7得到的所有的K个关键词及其权重作为SVM分类器的输入,样本的类别作为输出,训练一个多类SVM分类器,得到一个包含所有花朵类别的种类信息的分类器,从而实现了花朵识别。S9:将新采集的未分类的图片输入训练好的SVM分类器中,即可得到对应的花朵种类信息。进一步地,所述的S5的SIFT特征生成的具体过程为:S5.1初始化K维计数器向量为0,每一维对应一个关键词的权重;S5.2然后将每幅图像样本的每个SIFT特征与K个类中心进行距离比较,在对应最小距离的那一维权重加12;S5.3得到K个关键词对。进一步地,所述的S6中K-means聚类过程具体为:S6.1:选取K个类中心,对提取的所有M个SIFT特征,每隔M/K个取一个类中心;S6.2:计算每个SIFT特征与每个类中心的距离,并将每个SIFT特征归入距离最近的类中心;S6.3:更新类中心;S6.4:迭代直到达到指定的精度,获得K个类中心,即K个关键词SIFT特征。进一步地,所述的S1中花朵图片的采集过程为:首先选择相机拍照背景为单调深颜色,然后利用此背景对大自然的花朵进行拍照,采集花朵样本,得到的样本图片中背景都为深色。进一步地,所述的S2中图像的灰度和阈值处理的具体过程为:S2.1根据公式Y=0.3R+0.59G+0.11B,将采集的三通道彩色图片转换为单通道灰度图片,式中,B、G、R分别表示彩色图像的三通道颜色像素值。S2.2根据公式设置固定灰度阈值T,将上述灰度图像中图像阈值大于T的区域分割提取出来,作为ROI区域;其中,g(x,y)为所得的二值图像,f(x,y)为灰度图像,T为所设固定阈值。进一步地,所述的S3中ROI区域提取需要设定提取面积上、下限值,当提取面积不符合要求时,该图片不符合训练标准,则将其舍弃。本专利技术的有益效果如下:(1)本专利技术的花朵种类的识别的方法没有过多的图像预处理环节,通过灰度阈值处理找出了ROI矩形区域和四边定位法确定了牡丹花的位置,使用非常方便,而且分类正确率较高;(2)通过基于机器学习的SVM方法来对花朵进行智能识别,使识别更快、更方便、识别率更高。附图说明图1是本专利技术的基于机器学习的花朵种类的识别方法的流程图;图2为采用本专利技术的方法对花朵识别过程图,其中,图2a为灰度图,图2b为二值化的图,图2c为四边定位后的图。具体实施方式下面根据附图和优选实施例详细描述本专利技术,本专利技术的目的和效果将变得更加明白,以下结合附图和实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术的原理为:如图1所示,采集用于训练的包含花朵的图片放入样本库中,对每幅图像先进行图像预处理操作分割出ROI区域,在ROI的位置建立二维坐标系,然后对花朵进行四边定位,确定出花朵的矩形区域位置。对每个样本的ROI区域提取出所有的SIFT特征,然后对每个样本的SIFT特征进行K-means聚类,得到该样本信息的K个关键词及其权重。随后,把所有样本的关键词和权重作为输入、花朵类型作为输出,来训练一个多类SVM分类器,得到包含所有花朵的种类信息。作为其中一种实施例,本专利技术的基于机器学习的花朵种类的识别方法的具体步骤如下:S1:采集用于训练的若干类的包含花朵的图片,采集的训练图片中的花朵尽量覆盖尽可能多的种类的花朵,具体过程如下:选择相机拍照背景为单调深颜色,然后利用此背景对大自然的花朵进行拍照,采集花朵样本,得到的样本图片中背景都为深色。S2:对所述的花朵图片进行灰度处理(如图2a所示)和阈值处理,得到对应的二值化图像(如图2b所示),作为其中一种实施方式,具体步骤如下:S2.1根据公式Y=0.3R+0.59G+0.11B,将采集的花朵图片三通道彩色图片转换为单通道灰度图片,式中,B、G、R分别表示彩色图像的三通道颜色像素值。S2.2再根据公式设置固定灰度阈值T,将上述灰度图像中图像阈值大于T的区域分割提取出来,作为ROI区域,其中,g(x,y)为所得的二值图像,f(x,y)为灰度图像,T为所设固定阈值。S3:将上述二值化图像中可能包含花朵的ROI区域进行分割提取出来,具体如下:根据固定阈值将图像二值化处理,提取图像中白色的本文档来自技高网...

【技术保护点】
1.一种基于机器学习的花朵种类的识别方法,其特征在于,该方法具体包括如下步骤:/nS1:采集用于训练的包含花朵的图片;/nS2:对所述的花朵图片进行灰度处理和阈值处理,得到对应的二值化图像;/nS3:将该二值化图像中可能包含花朵的ROI区域进行分割提取出来;/nS4:然后根据四边定位法对ROI区域进行花朵准确定位,所述的四边定位法具体过程为:/n(1)先对ROI区域进行建立二维直角坐标系,根据坐标系确定ROI区域边缘点的坐标;/n(2)对于ROI区域的任意一边,随机选取10-20个边缘点,计算边缘点的方差值,然后忽略误差较大的1个或两个边缘点,利用线性回归对剩下的边缘点进行回归直线拟合。/n(3)最后对四条边均进行线性回归直线拟合,即得到包含花朵的矩形区域,从而实现对花朵的定位。/nS5:对于每个花朵样本,均提取定位图像的所有SIFT特征;/nS6:对每个定位图像提取到的所有SIFT特征进行聚类,得到生成特征的K个关键词及其权重;/nS7:重复S2-S6,得到所有训练的包含花朵的图片的K个关键词及其权重和样本类别;/nS8:将S7得到的所有的K个关键词及其权重作为SVM分类器的输入,样本的类别作为输出,训练一个多类SVM分类器,得到一个包含所有花朵类别的种类信息的分类器,从而实现了花朵识别。/nS9:将新采集的未分类的图片输入训练好的SVM分类器中,即可得到对应的花朵种类信息。/n...

【技术特征摘要】
1.一种基于机器学习的花朵种类的识别方法,其特征在于,该方法具体包括如下步骤:
S1:采集用于训练的包含花朵的图片;
S2:对所述的花朵图片进行灰度处理和阈值处理,得到对应的二值化图像;
S3:将该二值化图像中可能包含花朵的ROI区域进行分割提取出来;
S4:然后根据四边定位法对ROI区域进行花朵准确定位,所述的四边定位法具体过程为:
(1)先对ROI区域进行建立二维直角坐标系,根据坐标系确定ROI区域边缘点的坐标;
(2)对于ROI区域的任意一边,随机选取10-20个边缘点,计算边缘点的方差值,然后忽略误差较大的1个或两个边缘点,利用线性回归对剩下的边缘点进行回归直线拟合。
(3)最后对四条边均进行线性回归直线拟合,即得到包含花朵的矩形区域,从而实现对花朵的定位。
S5:对于每个花朵样本,均提取定位图像的所有SIFT特征;
S6:对每个定位图像提取到的所有SIFT特征进行聚类,得到生成特征的K个关键词及其权重;
S7:重复S2-S6,得到所有训练的包含花朵的图片的K个关键词及其权重和样本类别;
S8:将S7得到的所有的K个关键词及其权重作为SVM分类器的输入,样本的类别作为输出,训练一个多类SVM分类器,得到一个包含所有花朵类别的种类信息的分类器,从而实现了花朵识别。
S9:将新采集的未分类的图片输入训练好的SVM分类器中,即可得到对应的花朵种类信息。


2.根据权利要求1所述的基于机器学习的花朵种类的识别的方法,其特征在于,所述的S5的SIFT特征生成的具体过程为:
S5.1初始化K维计数器向量为0,每一维对应一个关键词的权重;
S5.2然后将每幅图像样本的每...

【专利技术属性】
技术研发人员:王宪保杨敬肖本督吴梦岚陈斌
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1