一种图像场景识别方法及系统技术方案

技术编号:11288331 阅读:263 留言:0更新日期:2015-04-11 06:40
本发明专利技术公开了一种图像场景识别方法及系统,涉及图像识别技术领域,旨在提供一种能适应手机等智能移动终端内存相对较小,运算能力相对较弱,图像尺寸相对较小的特点的实时图像场景识别算法,本发明专利技术技术要点:分别提取图像的GIST特征值、LBP特征值与HSV特征值;将GIST特征值、LBP特征值与HSV特征值分别归一化;将归一化后的GIST特征值、LBP特征值与HSV特征值进行融合得到融合特征值;将融合特征值带入分类器中,分类器对融合特征进行识别并输出场景类别。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种图像场景识别方法及系统,涉及图像识别
,旨在提供一种能适应手机等智能移动终端内存相对较小,运算能力相对较弱,图像尺寸相对较小的特点的实时图像场景识别算法,本专利技术技术要点:分别提取图像的GIST特征值、LBP特征值与HSV特征值;将GIST特征值、LBP特征值与HSV特征值分别归一化;将归一化后的GIST特征值、LBP特征值与HSV特征值进行融合得到融合特征值;将融合特征值带入分类器中,分类器对融合特征进行识别并输出场景类别。【专利说明】-种图像场景识别方法及系统
本专利技术设及图像识别
,尤其设及一种用于手机等智能移动终端的图像场 景识别方法。
技术介绍
随着数码设备特别是智能手机的普及和信息存储的快速发展,图像数据发生爆炸 式的增长,计算机视觉直接在移动设备上的运用就显得更外引人注意。 场景识别是计算机视觉和图像理解领域的一个重要方向,目前计算机上实现的场 景识别主要采用局部图像语义特征和全局图像语义特征建模。其中局部图像语义主要采用 图像的关键点来对场景建模,使用最广泛的关键点是SIFT特征关键点,模型一般采用BOW 模型。BOW模型即词袋模型,是将局部特征用最接近的视觉词汇来表述,最后统计视觉词汇 的直方图,采用相似函数来判断类别。生成视觉词汇主要采用K-mean算法。全局图像语义 特征建模是把整个图像当成一个整体进行建模,方法是采用图像的全局特征如GAB0R、LBP、 HOG等来描述,最后加入分类器如SVM分类器来判断类别。 目前应用于计算机平台的场景识别算法直接应用在手机等移动智能终端上会存 在如下的特点。 (1)实时性很差,不能实时的呈现识别结果,一般都有几秒的延长。 (2)像局部语义特征,运算相对复杂,需要内存较多。 做处理的图像尺寸不能太小,否则识别准确率不高。 [000引针对W上的缺点,很有必要提出一种能适应手机等智能移动终端内存相对较小, 运算能力相对较弱,图像尺寸相对较小的特点的实时图像场景识别算法。
技术实现思路
本专利技术所要解决的技术问题是;针对上述存在的问题,提供一种适用于手机等智 能移动终端的图像场景识别方法及系统。 本专利技术提供的一种图像场景识别方法,包括W下步骤: [00川步骤1 ;分别提取图像的GIST特征值、LBP特征值与HSV特征值; 步骤2 ;将GIST特征值、LBP特征值与服V特征值分别归一化; 步骤3 ;将归一化后的GIST特征值、LBP特征值与HSV特征值进行融合得到融合特 征值; 步骤4 ;将融合特征值带入分类器中,分类器对融合特征进行识别并输出场景类 别。 进一步,提取图像的GIST特征值的方法包括W下步骤: 选择5个尺度与8个方向的GABOR核; 将图像与上述40个GABOR核依次做卷积得到40个处理后的图像; [001引将每个处理后的图像分为bXb个小块,并计算每个小块的灰度均值,得到 40XbXb个灰度均值,40XbXb个灰度均值组成的向量即为40XbXb维的GIST特征值; 其中b的取值为3或4。 进一步,提取图像的LBP特征值的方法包括W下步骤: 设置3像素点X 3像素点的计算窗口; 将计算窗口加到图像上,比较计算窗口的周围点像素值是否大于中屯、点像素值, 若大于则将该周围点的像素点设为1,否则设为0,将8个周围点的像素值依次排列得到一 个8位无符号的二进制数,将该个无符号二进制数作为中屯、点的新像素值; 利用计算窗口遍历整个图像,得到图像中每个非边缘像素点的新像素值,并将各 边缘像素点的新像素值设为某值,即得到经过LBP处理后的图像; 将经过LBP处理后的图像分为cXc个小块,并分别计算每个小块灰度直方图,所 述灰度直方图中的灰度采用64阶表示,便得到每个小块中64个灰阶上分布的像素点数;将 C X C个小块64个灰阶上分布的像素点数依次排列最终得到C X C X 64维的LBP特征值; 其中C的取值为2或3。 进一步,提取图像的HSV特征值的方法包括W下步骤: 根据图像每个像素点的R、G、B值计算该像素点的H、S、V值; [002引将图像分为eXe个小块,并分别计算每个小块的颜色直方图,所述颜色直方图中 的颜色采用90阶表示,便得到每个小块中90个色阶上分布的像素点数;将e X e个小块90 个灰阶上分布的像素点数依次排列最终得到e X e X 90维的HSV特征值; 其中e的取值为2或3。 进一步,所述分类器为SVM分类器;训练所述SVM分类器的方法包括: 选取第一类场景的图片若干张,提取各第一类场景图片的融合特征值;将各第一 类场景图片的融合特征值与类别号依次输入SVM分类器,对SVM分类器进行训练; 选取第二类场景的图片若干张,提取各第二类场景图片的融合特征值;将各第二 类场景图片的融合特征值与类别号依次输入SVM分类器,对SVM分类器进行训练; W此类推,提取第N类场景图片的融合特征值;N为非零自然数;将各第N类场景 图片的融合特征值与类别号依次输入SVM分类器,对SVM分类器进行训练。 本专利技术还提供了一种图像场景识别系统,其特征在于,包括W下步骤: GIST特征值提取模块,用于提取图像的GIST特征值; LBP特征值提取模块,用于提取图像的LBP特征值; HSV特征值提取模块,用于提取图像的HSV特征值; [003引特征值归一化模块,用于将GIST特征值、LBP特征值与HSV特征值归一化; 特征值融合模块,用于将归一化后的GIST特征值、LBP特征值与HSV特征值进行 融合得到融合特征值; 分类器,用于对融合特征进行识别并输出场景类别。 GIST特征值提取模块进一步用于: 选择5个尺度与8个方向的GABOR核; 将图像与上述40个GABOR核依次做卷积得到40个处理后的图像; 将每个处理后的图像分为bXb个小块,并计算每个小块的灰度均值,得到 40XbXb个灰度均值,40XbXb个灰度均值组成的向量即为40XbXb维的GIST特征值; 其中b的取值为3或4。 LBP特征值提取模块进一步用于: 设置3像素点X 3像素点的计算窗口; 将计算窗口加到图像上,比较计算窗口的周围点像素值是否大于中屯、点像素值, 若大于将该周围点的像素点设为1,否则设为0,将8个周围点的像素值依次排列得到一个 8位无符号的二进制数,将该个无符号二进制数作为中屯、点的新像素值; 利用计算窗口遍历整个图像,得到图像中每个非边缘像素点的新像素值,并将各 边缘像素点的新像素值设为某值,即得到经过LBP处理后的图像; 将经过LBP处理后的图像分为cXc个小块,并分别计算每个小块灰度直方图,所 述灰度直方图中的灰度采用64阶表示,便得到每个小块中64个灰阶上分布的像素点数;将 cXc个小块64个灰阶上分布的像素点数依次排列最终得到cXcX64维的LBP特征值; 其中C的取值为2或3。 HSV特征值提取模块进一步用于: 根据图像每个像素点的R、G、B值计算该像素点的H、S、V值; 将图像分本文档来自技高网
...

【技术保护点】
一种图像场景识别方法,其特征在于,包括以下步骤:步骤1:分别提取图像的GIST特征值、LBP特征值与HSV特征值;步骤2:将GIST特征值、LBP特征值与HSV特征值归一化;步骤3:将归一化后的GIST特征值、LBP特征值与HSV特征值进行融合得到融合特征值;步骤4:将融合特征值带入分类器中,分类器对融合特征进行识别并输出场景类别。

【技术特征摘要】

【专利技术属性】
技术研发人员:张楠
申请(专利权)人:成都品果科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1