Spark平台下基于SURF‑BIT算法的图像检索系统技术方案

技术编号:16919310 阅读:258 留言:0更新日期:2017-12-31 14:52
Spark平台下基于SURF‑BIT算法的图像检索系统,Spark是专为大规模数据处理而设计的快速的计算引擎,用于克服检索速度和准确性方面的缺陷。相对于传统的SURF使用浮点数描述符表示图像特征点,BRISK使用均匀采样模式生成二进制描述符,本发明专利技术将两者融合减少了内存消耗并加快了图像检索速度。在图像匹配阶段,我们用RANSAC剔除预匹配点对中的误匹配点对,以进一步提高匹配点对的准确性。实验结果表明,与传统图像检索系统相比,我们提出的图像检索(CBIR)系统的检索速度和准确度达到了新的阶段。

【技术实现步骤摘要】
Spark平台下基于SURF-BIT算法的图像检索系统
本专利技术涉及图像数据处理领域,尤其涉及一种自适应遗传方法的显著性检测方法。
技术介绍
图像是一个重要的信息载体。随着多媒体技术和互联网的蓬勃发展,每天都会产生大量的图像数据。如何在海量图像数据库中快速准确地检索所需图像正成为一个迫切的问题。如何在大型图像数据库中有效检索相关图像是目前的图像检索CBIR(ContentBasedImageRetrieval),即基于内容的图像检索领域的一个热门话题。CBIR利用图像的低层特征(如形状,颜色,纹理,空间布局等)进行图像检索。在图像特征提取领域中,现有技术SIFT(Scale-InvariantFeatureTransform)和SURF是两种杰出的算法。SIFT利用图像金字塔检测不同尺度的特征点,并通过计算一个关键点的一组方向直方图来构建关键点描述符。虽然SIFT具有良好的表现,但建立图像金字塔花费大量的时间。SURF的特点是使用积分图像,大大加快了计算时间。一般来说,SURF具有更好的鲁棒性,并且比SIFT更快,但构建特征描述符仍然需要很多时间。为了进一步减少计算时间,研究人员提出了一些新的二进制特征描述符,如2011年Rublee提出的ORB(OrientedFASTandRotatedBRIEF)描述符,2011年由Leutenegger提出的BRISK描述符等。CBIR广泛应用于图像检索,如医疗诊断,预防犯罪等领域。然而,在TB或甚至PB级的图像数据库中,传统的CBIR的检索速度和准确度遇到瓶颈。
技术实现思路
本专利技术要解决的技术问题是:设计一种在TB或甚至PB级的图像数据库中,图像检索速度和准确度更高的图像检索系统。为了解决上述技术问题,本专利技术提出一种。Spark平台下基于SURF-BIT算法的图像检索系统,其特征在于:步骤1:对图像预处理,将原始图像上传到HDFS,并为每个图像名称重命名一个唯一的标识符ID;步骤2:利用SURF-BIT算法开始提取图像特征,并获得二进制的特征描述符,SURF-BIT算法的具体步骤如下:1.基于SURF的特征点检测:a)建立Hessian矩阵并得出Hessian矩阵的行列式近似值;b)使用不同尺寸的盒式过滤器来构建尺度空间;c)提取局部特征点;d)确定特征点的主要方向;2.建立基于BRISK的二进制的特征描述符:a)构造不同半径的同心圆,其圆心是SURF检测到的特征点;b)通过均匀采样模式获取N个采样点;c)生成二进制的特征描述符;步骤3:定义一个表示每个图像的图像类,所述的图像类包含该图像的特征描述符集合和图像的唯一标识符ID;步骤4:通过对象序列化技术,将所有图像对象保存到分布式文件系统HDFS中,完成图像数据库的构建;步骤5:将查询图像的特征描述符与步骤4中图像数据库中的图像的特征描述符进行比较,生成初匹配点对;步骤6:采用RANSAC消除误匹配的点对,从而获得更精确的匹配点对;步骤7:如果两张图像的匹配点对数超过阈值,认为这两张图像相似,并输出匹配图像的标识符ID。作为一种优选:步骤5的生成初匹配点对的方法是基于SURF-BIT描述符,通过计算描述符的汉明距离实现匹配:假设两个SURF-BIT描述符S1,S2,其汉明距离D可以定义如下:D的值越小,S1和S2之间的相似度越高;如果两个特征描述符的相似度超过阈值,则认为这对特征描述符是匹配的。本专利技术有益效果:1.改进SURF算法:将SURF算法和BRISK算法结合进行特点提取,减少了内存消耗并加快了图像检索速度。2.特征点匹配时使用RANSAC算法剔除误匹配点,增加匹配点的精确度。3.使用SPARK并行平台加快图像检索速度。附图说明附图1:本专利技术的CBIR系统工作流程图。附图2:本专利技术的检索系统与传统检索系统在系统执行速度的比较。具体实施方式本专利技术方法采用的技术要点包括:基本的SURF特征提取、BRISK特征描述符、Spark数据处理系统。(一)基本的SURF特征提取与SIFT不同,SURF的特征点检测基于Hessian矩阵。SURF通过查找Hessian矩阵行列式的局部最大值来定位特征点,并使用积分图像来加快计算速度。在σ尺度上,图像像素点X=(x,y)的Hessian矩阵定义如下公式(1):Lxx(x,σ)是高斯二阶微分和图像I=(x,y)在点卷积的结果。Lxy(x,σ)和Lyy(x,σ)意义类似。为了提高计算速度,提出使用盒式滤波器来近似代替高斯滤波,并利用积分图像加速卷积计算的过程。Hessian矩阵的近似行列式公式(2)是:det(Happrox)=Dxx×Dyy-(0.9×Dxy)2(2)其中Dxx,Dyy和Dxy是Lxx,Lyy和Lxy的近似通过不同尺寸的盒式过滤器,可以构建多尺度图像的金字塔。在多尺度图像的金字塔上,SURF通过比较其在当前尺度和相邻尺度上的26个邻域,对每个点执行非极大值抑制,找到一组候选特征点。然后,在尺度空间和图像空间中,进行插值运算以获得最终特征点。最后,为了确保旋转的不变性,SURF在特征点领域内计算Haar小波特征,为每个特征点分配主方向。(二)BRISK特征描述符BRISK采用均匀采样模式,以特征点为中心构造不同半径的同心圆,并且通过在每个圆上等间距采样获得N个采样点。为了避免混叠效应,BRISK对同心圆的采样点进行高斯滤波。由于存在N个采样点,所以这些采样点两两组合以形成N(N-1)/2点对,其由表达式A表示。高斯滤波后,两个采样点的像素分别为和,从而得出局部梯度g(pi,pj)。A=={(pi,pj)∈R2×R2|i<N,j<i,i,j∈N}.(3)短距离点对集Σ公式(5)和长距离点对集Λ公式(6)分别定义如下。利用上述公式,特征点的主要方向定义如下。其中gx是x方向的梯度,gy是y方向的梯度,L是Λ的元素的数量。为了保持旋转不变性,BRISK以角度α=arctant2(gx,gy),旋转采样区域。旋转后,在短距离配对S中比较点对构成长度为512的二进制特征描述符。每个比特位对应如下公式(8)。(三)Spark平台加州大学伯克利分校开发的ApacheSpark是一个大规模的数据处理系统。用于图形并行计算的GraphX,用于机器学习的MLLib,以及用于处理结构化数据的SparkSQL。不同的数据源可以访问Spark,包括分布式文件系统(如HadoopHDFS),分布式数据库(如ApacheHBase)和对象存储(如AmazonS3)。在Spark平台,任务的中间结果可以保存到内存中,因此Spark更适合迭代和交互式计算。Spark的所有分布式操作都是基于RDD(ResilientDistributedDataset),这是一个可并行化的数据集合。Spark提供了两种类型的操作:Transformation和Action。Transformation通过输入RDD处理产生一个新的RDD;Action计算所需的结果并将结果返回给driver节点。RDD上的操作是在内存中完成的,从而减少了大量的磁盘操作,并提高了分布式计算的性能。因此Spark更加适用于实时处理等数据挖掘工作。利用上述技术要点,本专利技术的图像检索系统进一步的采用SURF-BIT算法来提取本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/201710567034.html" title="Spark平台下基于SURF‑BIT算法的图像检索系统原文来自X技术">Spark平台下基于SURF‑BIT算法的图像检索系统</a>

【技术保护点】
Spark平台下基于SURF‑BIT算法的图像检索系统,其特征在于:步骤1:对图像预处理,将原始图像上传到HDFS,并为每个图像名称重命名一个唯一的标识符ID;步骤2:利用SURF‑BIT算法开始提取图像特征,并获得二进制的特征描述符,SURF‑BIT算法的具体步骤如下:1.基于SURF的特征点检测:a)建立Hessian矩阵并得出Hessian矩阵的行列式近似值;b)使用不同尺寸的盒式过滤器来构建尺度空间;c)提取局部特征点;d)确定特征点的主要方向;2.建立基于BRISK的二进制的特征描述符:a)构造不同半径的同心圆,其圆心是SURF检测到的特征点;b)通过均匀采样模式获取N个采样点;c)生成二进制的特征描述符;步骤3:定义一个表示每个图像的图像类,所述的图像类包含该图像的特征描述符集合和图像的唯一标识符ID;步骤4:通过对象序列化技术,将所有图像对象保存到分布式文件系统HDFS中,完成图像数据库的构建;步骤5:将查询图像的特征描述符与步骤4中图像数据库中的图像的特征描述符进行比较,生成初匹配点对;步骤6:采用RANSAC消除误匹配的点对,从而获得更精确的匹配点对;步骤7:如果两张图像的匹配点对数超过阈值,认为这两张图像相似,并输出匹配图像的标识符ID。...

【技术特征摘要】
1.Spark平台下基于SURF-BIT算法的图像检索系统,其特征在于:步骤1:对图像预处理,将原始图像上传到HDFS,并为每个图像名称重命名一个唯一的标识符ID;步骤2:利用SURF-BIT算法开始提取图像特征,并获得二进制的特征描述符,SURF-BIT算法的具体步骤如下:1.基于SURF的特征点检测:a)建立Hessian矩阵并得出Hessian矩阵的行列式近似值;b)使用不同尺寸的盒式过滤器来构建尺度空间;c)提取局部特征点;d)确定特征点的主要方向;2.建立基于BRISK的二进制的特征描述符:a)构造不同半径的同心圆,其圆心是SURF检测到的特征点;b)通过均匀采样模式获取N个采样点;c)生成二进制的特征描述符;步骤3:定义一个表示每个图像的图像类,所述的图像类包含该图像的特...

【专利技术属性】
技术研发人员:蒋林华龙伟黄婷婷楼俊钢顾永跟蒋云良
申请(专利权)人:湖州师范学院
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1