本发明专利技术公开了一种基于特征点匹配的图像去重方法和装置,提取冗余图像集中每幅图像的一阶颜色矩和二阶颜色矩特征,得到颜色特征向量;采用聚类算法对颜色特征进行聚类,将图像聚类到K个类中;提取所有图像中的SURF特征;对各个类中的图像分别进行SURF特征点匹配,若匹配点数目大于设定匹配阈值,则判定为相同图像,删除多余的图像;重复多次,得到去重后的图像数据集。本发明专利技术通过预分类,从而改进了特征点匹配需要两两对比造成的计算复杂度极大的缺点。
An image de duplication method and device based on feature point matching
【技术实现步骤摘要】
一种基于特征点匹配的图像去重方法和装置
本专利技术提出一种基于特征点匹配的图像去重方法和装置,涉及图像处理
技术介绍
随着信息时代的到来,相机、手机等拍照工具的快速发展,网络上的图像数据发生爆炸式的增长。然而,在这些图像之中存在大量重复或者相似的冗余图像,这使我们需要消耗大量的资源去存储及管理它们。同时,大量冗余的图像会影响我们对图像进一步的处理以及利用,所以需要对冗余的图像采取去重处理的措施。而对数据量巨大的图像通过人工筛选的方式进行去重是不现实的,所以迫切地需要一种能够智能地判断图像是否重复,并删除多余图像的方法。在图像的特征中,有许多特征可以用来描述图像相似度,如颜色特征、纹理特征、形状特征、空间关系特征等。但这些特征都具有局限性,如颜色特征对图像的方向、大小等不敏感,不能够反映图像的局部特征。因此,如果只运用这些特征来判断相似性会产生巨大的误差。相比这些初级特征,运用特征点来描述图像相似度计算量比较小,同时特征点具有较好的鲁棒性,受光照条件、旋转、尺度变化的影响较小。因此,采用特征点匹配来判断两幅图像的相似程度能够大幅度地提高图像去重的精度。常用的特征点提取算法有SIFT算法、SURF算法、ORB算法等。其中SIFT特征(ScaleInvariantFeatureTransformation),即尺度不变特征,不但具有尺度不变性,同时当图像发生旋转、角度变化、亮度改变时也能够实现匹配。而SURF特征(SpeedUpRobustFeature)是对SIFT特征的改进,利用Hessian(海森)矩阵和降维的特征描述算子来提升算法的执行效率,被广泛应用于计算机视觉的物体识别和3D重构中。SURF特征相比于SIFT,运算量极大地减少了。ORB特征(OrientedFASTandRotatedBRIEF)在运算速度上比SURF要快,但是对特征点的描述没有SURF特征细致,所以匹配效果相比于SURF算法较差。因此采取SURF进行特征点提取能够兼顾效率与精度实现图像去重。在完成特征点提取之后,需要进行特征点匹配来判断图像的相似度。但是当图像数据量较大时,对每幅图像进行两两匹配会导致算法的计算量呈几何倍数增长。
技术实现思路
为解决现有技术中的不足,本专利技术提供一种基于特征点匹配的图像去重方法和装置,解决了特征点匹配需要两两对比造成的计算复杂度极大的问题。为了实现上述目标,本专利技术采用如下技术方案:一种基于图像特征点匹配的图像去重方法,包括步骤:步骤1,提取冗余图像集中每幅图像的一阶颜色矩和二阶颜色矩特征,得到颜色特征向量;步骤2,采用聚类算法对颜色特征进行聚类,将图像聚类到K个类中;步骤3,提取所有图像中的SURF特征;步骤4,对各个类中的图像分别进行SURF特征点匹配,若匹配点数目大于设定匹配阈值,则判定为相同图像,删除多余的图像;重复步骤2~4若干次,得到去重后的图像数据集。进一步的,一阶颜色矩和二阶颜色矩特征为:其中,μi为第i个图像的一阶颜色矩,pij为第i个图像第j个像素的灰度值,N为第i个图像的像素点总数,σi是第i个图像的二阶颜色矩,j为像素点序号,j=1,2,…,N。进一步的,聚类算法为K-means聚类算法,K=M/10取整,其中M表示图像的数量。进一步的,设置匹配阈值为16,若匹配点数大于设定的阈值,则判定图像相同,删除多余的图像。一种基于图像特征点匹配的图像去重装置,包括:颜色特征提取模块,用于提取冗余图像集中每幅图像的一阶颜色矩和二阶颜色矩特征,得到颜色特征向量;聚类模块,用于采用聚类算法对颜色特征进行聚类,将图像聚类到K个类中;SURF特征提取模块,用于提取所有图像中的SURF特征;SURF特征点匹配模块,用于对各个类中的图像分别进行SURF特征点匹配,若匹配点数目大于设定匹配阈值,则判定为相同图像,删除多余的图像;重复若干次聚类和匹配过程,得到去重后的图像数据集。进一步的,一阶颜色矩和二阶颜色矩特征为:其中,μi为第i个图像的一阶颜色矩,pij为第i个图像第j个像素的灰度值,N为第i个图像的像素点总数,σi是第i个图像的二阶颜色矩,j为像素点序号,j=1,2,…,N。进一步的,聚类算法为K-means聚类算法,K=M/10取整,其中M表示图像的数量。进一步的,设置匹配阈值为16,若匹配点数大于设定的阈值,则判定图像相同,删除多余的图像。本专利技术所达到的有益效果:本专利技术能够准确地检测到冗余的图像,并删除多余的图像,且不存在误删,在图像数据爆炸式增长的情况下,能够高效地获取去冗余的图像,进而节省存储空间,同时更加有效和精确地处理图像;本专利技术提出了预分类的过程,从而改进了特征点匹配需要两两对比造成的计算复杂度极大的缺点。同时通过加大预分类数目并且多次进行处理的步骤,在不改变精度的情况下进一步降低了算法的计算复杂度。本专利技术采用SURF特征匹配,具有很好的鲁棒性,对于尺度、拍摄角度、光照强度等变化时都能够很好的匹配到相似的图像。附图说明图1是本专利技术具体实施方式中的一种方法流程图。具体实施方式下面结合附图对本专利技术作进一步描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。为了解决图像两两匹配造成的计算复杂度极大的问题,在图像特征点提取后,本专利技术先对图像进行预分类,以此减少算法的运算复杂程度。为了完成预分类,需要选取一种或几种图像特征作为分类依据,选用简单的全局特征如一阶颜色矩和二阶颜色矩来完成分类,从而进一步减少计算复杂度。本专利技术在搜集的无人机图像中,进行了大量的测试,对于10063张包含冗余的图像中,经过该算法的处理后,最后保留1795张图像,且其中不再含有相似图像,说明了本专利技术提出的技术具有非常好的准确性和实用性。实施例1:一种基于图像特征点匹配的图像去重方法,包括步骤:步骤1,提取冗余图像集中每幅图像的一阶颜色矩和二阶颜色矩特征,得到颜色特征向量;步骤2,采用聚类算法对颜色特征进行聚类,将图像聚类到K个类中;步骤3,提取所有图像中的SURF特征;步骤4,对各个类中的图像分别进行SURF特征点匹配,若匹配点数目大于设定匹配阈值,则判定为相同图像,删除多余的图像;重复步骤2~4若干次,得到去重后的图像数据集。进一步的,一阶颜色矩和二阶颜色矩特征为:其中,μi为第i个图像的一阶颜色矩,pij为第i个图像第j个像素的灰度值,N为第i个图像的像素点总数,σi是第i个图像的二阶颜色矩,j为像素点序号,j=1,2,…,N。进一步的,聚类算法为K-means聚类算法,K=M/10取整,其中M表示图像的数量。进一步的,设置匹配阈值为16,若匹配点数大于设定的阈值,则判定图像相同,删除多余的图像。本文档来自技高网...
【技术保护点】
1.一种基于图像特征点匹配的图像去重方法,其特征在于,包括步骤:/n步骤1,提取冗余图像集中每幅图像的一阶颜色矩和二阶颜色矩特征,得到颜色特征向量;/n步骤2,采用聚类算法对颜色特征进行聚类,将图像聚类到K个类中;/n步骤3,提取所有图像中的SURF特征;/n步骤4,对各个类中的图像分别进行SURF特征点匹配,若匹配点数目大于设定匹配阈值,则判定为相同图像,删除多余的图像;重复步骤2~4若干次,得到去重后的图像数据集。/n
【技术特征摘要】
1.一种基于图像特征点匹配的图像去重方法,其特征在于,包括步骤:
步骤1,提取冗余图像集中每幅图像的一阶颜色矩和二阶颜色矩特征,得到颜色特征向量;
步骤2,采用聚类算法对颜色特征进行聚类,将图像聚类到K个类中;
步骤3,提取所有图像中的SURF特征;
步骤4,对各个类中的图像分别进行SURF特征点匹配,若匹配点数目大于设定匹配阈值,则判定为相同图像,删除多余的图像;重复步骤2~4若干次,得到去重后的图像数据集。
2.根据权利要求1所述的一种基于图像特征点匹配的图像去重方法,其特征是,一阶颜色矩和二阶颜色矩特征为:
其中,μi为第i个图像的一阶颜色矩,pij为第i个图像第j个像素的灰度值,N为第i个图像的像素点总数,σi是第i个图像的二阶颜色矩,j为像素点序号,j=1,2,…,N。
3.根据权利要求1中所述的一种基于图像特征点匹配的图像去重方法,其特征在于,聚类算法为K-means聚类算法,K=M/10取整,其中M表示图像的数量。
4.根据权利要求1中所述的一种基于图像特征点匹配的图像去重方法,其特征在于,设置匹配阈值为16,若匹配点数大于设定的阈值,则判定图像相同,删除多余的图像。
5.一种基于图像...
【专利技术属性】
技术研发人员:罗旺,彭启伟,郝小龙,张佩,夏源,吴超,
申请(专利权)人:南京南瑞信息通信科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。