一种基于数字图像内容的图书检索方法技术

技术编号:13013503 阅读:88 留言:0更新日期:2016-03-16 10:46
本发明专利技术公开了一种基于数字图像内容的图书检索方法,包括以下步骤:将选取出的样本图书图像进行分辨率归一化操作,并进行多特征层面的图像描述,然后对每种图书进行学习训练,以此得到不同的训练识别模型;将获取的待检索图书图像矫正为矩形,然后对其进行分辨率归一化操作,在获取出相应的图像后对其进行多特征层面的图像描述,将特征数据输入训练识别模型中进行初始结果的预测;在得到初始预测结果后,分别判断最大可能的两类结果与其判别中心的高斯分布,概率值最高的那一类,确定为最终的检索结果。本发明专利技术充分利用图像的底层特征特性并通过自动学习与模型概率判别策略,提高了检索准确率,可以进行大规模的基于数字图像的图书检索工作。

【技术实现步骤摘要】

本专利技术属于计算机视觉领域,是图像检索领域中的一项重要应用,尤其是涉及。
技术介绍
模糊C均值聚类算法是一种自适应聚类学习算法,它能够根据不同类别的输入训练样本特征值自动计算出对应的特征中心,从而为后续的识别与检测工作提供可靠的先验知识。这种方法的优点是,在样本特征表征全面且样本量充足的条件下能够进行很好的分类工作,同时对于不良数据的容忍力较强,可以适应多种不同的数据环境。因此该算法广泛应用于数据挖掘、图像分类、图像检索、图像物体识别、视频对象跟踪等多个图像处理领域。近年来伴随数据量的不断增加,该技术的应用在一定程度上推动了计算机视觉技术的发展。基于图像的图书检索是图像检索的一项重要应用。一方面它可以根据图像快速的检索出对应的图书信息,从而免去了人工手动输入文字查询图书信息的环节;另一方面通过图像检索大大简化了信息查找的难度,完成了所见即所得的查找模式。目前有一些有关基于图像的图书检索方面的研究,也出现了一些相应的方法,其中相当多的方法都用到了图像特征和先验学习。从基于图像的图书检索技术角度来分,大致可以分为两大类:基于图像特征描述的图书图像检索和基于信息标注的图书图像检索,本文关注的重点在于前者。总体来说,基于信息标注的图书图像检索,由于会受到标注信息不准,标注信息不全面不能有效地满足各类识别情况等影响,使得该类方法的识别容易受到影响,并且适应的环境也相对局限,不具有有效地进行一对一检索,此外由于信息标注工作量大维护困难,所以该方法在一定程度上受到了应用限制。相对来讲基于图像特征的方法准确率较高,图像的多特征描述能够有效的分析图书的边缘、颜色、角点等信息,再通过聚类分析能够在训练样本足够大的情况下找到不同图书之间的分界线,此外该类方法对于无关数据的干扰有较强的容忍度,能够适应较多的识别场景。但是基于训练学习的方法需要选取全面描述图像的特征以充分的获取分类面,另外,对于不同聚类学习算法的输出需要寻找一种合适的结果获取规则进行最终结果的获取。伴随图形图像专业方向的不断发展,图像检索的功能会越来越完善,对于图书图像检索要求会越来越高,但是检索识别的环境却越来越复杂。因此制定出一种可靠、鲁棒的图书检索识别算法是十分有必要的。
技术实现思路
本专利技术的目的在于针对现有技术存在的不足,提出了。该方法以描述图书图像的多种特征为基础,融入了聚类学习与概率分布确立的思想,充分提高了图书检索的效率,可以有效地进行不同场景下的图书图像检索识别,对于图像检索系统是有积极意义的。为实现上述目的,本专利技术公开了,该方法包括以下步骤:将选取出的样本图书图像进行分辨率归一化操作,并进行多特征层面的图像描述,然后对每种图书进行学习训练,以此得到不同的训练识别模型;将获取的待检索图书图像矫正为矩形,然后对其进行分辨率归一化,在获取出相应的图像后对其进行多特征层面的图像描述,将特征数据输入所述训练识别模型中进行初始结果的预测;所述预测结果中包含当前待检索图书最大可能的前两种结果;在得到初始预测结果后,分别判断最大可能的两类结果与其判别中心的高斯分布,概率值最高的那一类,确定为最终的检索结果。优选地,多特征层面的图像描述包括:描述图书图像整体颜色分布的颜色矩特征、描述整幅图像边缘的边缘直方图特征和用于描述图书图像角点的角点特征中的一种或多种;优选地,样本图书图像在进行图书图像特征提取时全部进行分辨率归一化操作。优选地,样本图书图像在进行颜色矩特征提取时,在分辨率归一化操作结束后,先进行伽马滤波,接着将样本图书图像分解成有交叠的图像区块,其中每两个相邻的图像区块重叠率是其面积的0.3到0.5倍,然后计算图像中相应区块的颜色特征值,最后统计输出整幅图像的颜色信息。优选地,样本图书图像在进行颜色矩特征提取时,首先对样本图书图像进行分块处理。优选地,样本图书图像在进行角点特征提取时,在分辨率归一化操作结束后对彩色图像进行灰度化处理。优选地,样本图书图像在进行边缘直方图特征提取时,在分辨率归一化操作结束后对彩色图像中的每个颜色通道图像都进行高斯滤波,将图像分解成有交叠的图像区块,其中每两个相邻的图像区块重叠率是其面积的0.3到0.5倍,然后在每个图像区块中统计图像在360度范围内的梯度分布情况,最后统计输出整幅图像的边缘信息描述值。优选地,在得到描述图像的各类特征后,用模糊C均值聚类算法对样本特征进行聚类学习,在训练学习之前要对所选样本特征数据进行合并以得到整体的训练学习参数。优选地,进行初始结果的预测步骤包括:在计算获得初始结果前,按照树的广度优先策略进行中心遍历并计算相似度,最后相似度最大的两类被作为初始候选结果。优选地,训练识别模型是通过基于聚类思想的学习算法,对每种图书进行学习训练后获取。本专利技术能够全面的描述图像的颜色、角点和边缘信息,特征数据聚类技术能够对无关数据的干扰有较强的容忍度,并且能够适应多种识别场景。在获得初始预测结果后为精确的融合结果采用了高斯概率判别理论,有效的提高了图书检索的准确率。【附图说明】图1为本专利技术实施例提供的流程示意图;图2为本专利技术实施例提供的颜色矩特征提取方法流程示意框图;图3为本专利技术实施例提供的边缘直方图特征提取方法流程示意框图;图4为本专利技术实施例提供的角点特征提取方法流程示意框图。【具体实施方式】结合附图,本专利技术实施例的基本思想是针对图书图像检索的实际情况,将整个识别工作分为三个部分。在进行图书图像检索之前,首先对图书图像进行矩形矫正、归一化再进行一系列特征提取以及基于聚类思想的学习与训练,以得到图书图像库的特征聚类中心;然后在识别阶段根据得到的待检索图书图像再进矩形矫正、行归一化与特征提取,将所得特征放入图书图像库模型中得到初始结果;最后再根据高斯概率分布理论对初始结果进行融合以得到最后的检索结果。以上方法可以适应多种识别场景,并在相当的程度上提高了识别精度。图1为本专利技术实施例提供的流程示意框图。如图1所示,该方法包括步骤101-103:在步骤101、将选取出的样本图书图像进行分辨率归一化操作,并进行多特征层面的图像描述,然后对每种图书进行学习训练,以此得到不同的训练识别模型。具体地,在图书图像检索的学习训练阶段,首先对相应的样本图书图像进行矩形矫正、分辨率归一化操作,再提取描述图像整体边缘信息的边缘直方图特征(提取方法流程图如图2所示)、描述图像颜色信息的颜色矩特征(提取方法流程图如图3所示)和用于描述图像角点的角点特征(提取方法流程图如图4所示),然后通过基于聚类思想的学习算法进行归类学习,旨在为后续的具体识别过程提供良好的判别识别模型。优选地,样本图书图像在进行多类特征提取时,分辨率按照图像的原始尺度,归一化为合适的大小;样本图书像当前第1页1 2 本文档来自技高网
...

【技术保护点】
一种基于数字图像内容的图书检索方法,其特征在于,包括以下步骤:将选取出的样本图书图像进行分辨率归一化操作,并进行多特征层面的图像描述,然后对每种图书进行学习训练,以此得到不同的训练识别模型;将获取的待检索图书图像矫正为矩形,然后对其进行分辨率归一化操作,在获取出相应的图像后对其进行多特征层面的图像描述,将特征数据输入所述训练识别模型中进行初始结果的预测;所述预测结果中包含当前待检索图书最大可能的前两种结果;在得到初始预测结果后,分别判断最大可能的两类结果与其判别中心的高斯分布,概率值最高的那一类,确定为最终的检索结果。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:公绪超吴柯维郭长全
申请(专利权)人:北京卓视智通科技有限责任公司公绪超
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1