一种自动进行描述图像的方法技术

技术编号:7171811 阅读:538 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种自动进行描述图像的方法,包括以下步骤:对图像进行三级分割;提取图像纹理特征;提取图像颜色特征;多关键字描述。本发明专利技术完成每个子图像的纹理和颜色的特征提取后,将每个子图像的纹理和颜色的特征合并,每个子图像都用一个合并后的单一特征向量代表,将每个特征向量输入至预先训练好的支持向量机,即可将图像库转化为对图像描述的文本库,并用文本搜索的方式,为该文本库建立索引;当用户提交查询请求时,检索文本索引,找到与用户查询相符合的图像描述,从而返回与这些描述对应的图像;由此可见,本发明专利技术使图像搜索转化为文本搜索,避免了基于内容图像检索时,逐一计算图像高维度特征向量,因此提高了搜索的效率和准确性。

【技术实现步骤摘要】

本专利技术涉及一种图像的描述方法,特别是。
技术介绍
如今,随着信息化的不断深入,人们将会获得越来越多的海量数字图像数据,如何帮助人们快速的找到有用的图像信息将是图像分析处理的重要一个任务。传统的图像分析往往着重于对图像资源的底层特征的分析,相应的检索技术也侧重于依赖底层特征匹配, 如用户提交一幅实际的示例图像,系统根据该图像的颜色、纹理、形状等等信息在数据库中进行查询,但是随着图像数据指数级的增加,图像种类的急剧膨胀,基于底层特征匹配的图像分析检索技术已经显得力不从心,在检索的准确率和效率方面无法达到用户的要求。最显著的问题是“语义鸿沟”问题,目前的图像分析方法只能从图像中抽取出一些表示其底层视觉性质的特征,如颜色分布、空间纹理、区域形状等等。而人们在描述图像内容时往往使用代表语义的概念,而不是颜色、纹理等视觉特征,因此,现有的方法难以在这两种图像的表达方式之间建立起比较明确、稳定的对应关系,图像所蕴含的高层语义与底层特征之间存在着较大的差距,这个巨大的差距影响了基于内容的图像检索的效果;其次,这些底层特征往往表示为具有很高维数的特征向量,从而,基于内容的图像检索就转化成为了高维向量空间的搜索,当图像的数量快速增长时,如何快速、准确地搜索高维空间是一个非常困难的问题。因此,建立图像的语义表示和检索机制势在必行。
技术实现思路
为解决上述问题,本专利技术提出,可以自动获取图像的语义信息,将图像转化成简洁的多关键字形式的语义描述,从而使用文本检索的方式为图像的语义描述建立索引,使图像搜索转化为文本搜索以提高搜索的效率和准确性。为了实现上述目的,本专利技术的技术方案如下,包括以下步骤A、对图像进行三级分割将图像按照以下方式分割为三级一级图像即原图,不用分割;二级子图像将图像分成2*2的四个子块,另外将图像中间部分分割出来,共五块子图像;三级子图像将图像分成4*4的十六个子块;由此,一幅图像共分割成二十二个子图像,针对每一幅子图像分别进行B、C步骤;B、提取图像纹理特征对于一幅图像,利用公式⑴计算每个像素点的灰度值权利要求1. ,其特征在于包括以下步骤A、对图像进行三级分割将图像按照以下方式分割为三级 ー级图像即原图,不用分割;ニ级子图像将图像分成2*2的四个子块,另外将图像中间部分分割出来,共五块子图像;三级子图像将图像分成4*4的十六个子块;由此,一幅图像共分割成二十ニ个子图像,针对每一幅子图像分别进行B、C步骤;B、提取图像纹理特征对于一幅图像,利用公式(1)计算每个像素点的灰度值全文摘要本专利技术公开了,包括以下步骤对图像进行三级分割;提取图像纹理特征;提取图像颜色特征;多关键字描述。本专利技术完成每个子图像的纹理和颜色的特征提取后,将每个子图像的纹理和颜色的特征合并,每个子图像都用一个合并后的单一特征向量代表,将每个特征向量输入至预先训练好的支持向量机,即可将图像库转化为对图像描述的文本库,并用文本搜索的方式,为该文本库建立索引;当用户提交查询请求时,检索文本索引,找到与用户查询相符合的图像描述,从而返回与这些描述对应的图像;由此可见,本专利技术使图像搜索转化为文本搜索,避免了基于内容图像检索时,逐一计算图像高维度特征向量,因此提高了搜索的效率和准确性。文档编号G06K9/62GK102360431SQ20111030262公开日2012年2月22日 申请日期2011年10月8日 优先权日2011年10月8日专利技术者屈莉莉, 李桃迎, 汲业, 牟向伟, 陈燕 申请人:大连海事大学本文档来自技高网...

【技术保护点】
成4*4的十六个子块;由此,一幅图像共分割成二十二个子图像,针对每一幅子图像分别进行B、C步骤;B、提取图像纹理特征对于一幅图像,利用公式(1)计算每个像素点的灰度值:***对于每个像素点在某邻域内的灰度变化,考虑该像素点的3*3邻域,它包括9个像素点,其中Ii(i=0,1,…,8)表示图像在该像素点处的灰度,I0所在位置为中心点,用矩阵表示为***因此像素点I0的灰度变化值为:从公式(2)容易看出,T看作八位二进制数,它的取值为T∈{0,1,...,255};计算图像所有像素点的T值,T(i,j)表示像素点I0(i,j)处的值,hk(k=0,1,...,255)表示T值为k的像素点数量与总像素的比值,则:***其中n和m分别为图像的高度和宽度,f(i,j,k)表示为:***由此得图像的纹理特征向量空间模型{h0,h1,...,h255};C、提取图像颜色特征对于图像的每个像素点,由RGB变换到R’G’B’:***再由R’G’B’变换到HSV:其中,H∈[0,360],S∈[0,1],V∈[0,1];式中,R、G和B分别代表RGB颜色空间中的红色、绿色和蓝色;HSV颜色空间的色调H是由颜色名称来辨别的,如红、橙、绿,它用角度0°~360°度量;亮度V是颜色的明暗程度,通常用百分比度量,从黑0%到白100%;色度或饱和度S指颜色的深浅,例如同样是红色,也会因浓度不同而分为深红和浅红,它也用百分比来度量,从0%到完全饱和的100%;将H、S、V三个分量按照颜色感知进行非等间隔的量化,从对颜色模型的大量分析,把色调H空间分成8份,饱和度S和亮度V空间分别分成3份,并根据色彩的不同范围进行量化,量化后的色调、饱和度和亮度值分别为H’、S’和V’;***按照以上的量化级,把三个颜色分量合成为一维特征矢量:l=H′QSQV+S′QV+V′                (8)其中,Qs和Qv分别是分量S和V的量化级数,由式(7)可知,S和V都被量化为0、1或2三级,因此S和V的量化级数为Qs’=3,Qv=3;因此公式(8)式表示为:L=9H′+3S′+V′                    (9)将H’S’V’三个分量转化为一维矢量;根据公式(7)和(9)可得L∈{0,1,...,71}(10)计算图像所有像素点的L值,L(i,j)表示像素点(i,j)处的值,lk(k=0,1,...,255)表示L值为k的像素点数量与总像素的比值,则:***其中n和m分别为图像的高度和宽度,g(i,j,k)表示为:***由此得图像的纹理特征向量空间模型{l0,l1,...,l71};D、多关键字描述完成每个子图像的纹理和颜色的特征后,将每个子图像的纹理和颜色的特征合并,每个子图像都用一个合并后的单一特征向量代表,将每个特征向量输入至预先训练好的支持向量机,该支持向量机使用径向基核函数,由2582张分属动物、植物、室内装饰、建筑、车、人、天空和太空八类的图片训练而成;设R(i,j,k)作为分类的判定结果,即第j级分割的第k张子图像imagek,属于第i类Categoryi,***由此,计算整幅图像属于第i类的量化值ri,考虑到整体与局部对图像内容理解的不同贡献,采用相应的加权策略,***其中,权重系数w1为1,w2为0.2,w3为0.0625,显然ri在[1,3]之间,当ri大于0.3即可将该类别作为关键字赋予图像。1.一种自动进行描述图像的方法,其特征在于:包括以下步骤:A、对图像进行三级分割将图像按照以下方式分割为三级:一级图像:即原图,不用分割;二级子图像:将图像分成2*2的四个子块,另外将图像中间部分分割出来,共五块子图像;三级子图像:将图像分...

【技术特征摘要】

【专利技术属性】
技术研发人员:汲业陈燕李桃迎牟向伟屈莉莉
申请(专利权)人:大连海事大学
类型:发明
国别省市:91

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1