System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机图像处理,具体为基于多层特征融合和改进相似度聚类图像去重方法。
技术介绍
1、随着科学技术的发展,以及图像数据采集方式的不断更新迭代,图像数据量逐渐增大,难免会有一张或多张重复图像混合在图像集中,使用人工方法对其中的重复或者图像进行归类,或者去除,不仅耗时耗力,而且难以保证没有遗漏,所以需要开发一种高效快速准确度高的相似图像冗余消除算法。
2、重复图像通常指的是内容、颜色、尺寸、方向等完全相同的图像,这类图像在特点上完全一致,所以在对这类图像去重时较为容易,使用一般的方法即可实现;而在实际情况中,大部分情况下,重复的图像之间并不完全相同,也可能是内容较为相似的图像,尤其是使用相机进行连续拍摄的图像,可能在人眼看起来内容区别不大,但是对于计算机来说已经有较大改变,或者是经过计算机处理后的图像,如翻转、平移、亮度改变等,对于计算机来说,也可能是较大的改变,但就图像内容而言仍属于重复图像。
3、目前针对重复图像的去重算法,可以大致分成两类:一类是针对完全相同的图像去重算法,另一类是通过特征提取对相似图像进行去重的算法。
4、针对完全相同的图像,一般使用的去重算法有直方图比较、md5值比较、余弦相似度比较、hash值比较等。基于直方图比较的去重算法,是将图像的像素强度分布以直方图形式表示出来,并比较直方图差异大小,判断图像是否重复,因此这种算法受图像像素影响较大,且在图像明暗变化时,不能得到很好的结果。基于md5值的去重算法,要求重复图片的数据高度一致,有任何差异其计算出的md5值
5、基于特征提取实现相似图像去重的算法,一般有基于org特征提取的去重算法、基于sift(尺度不变特征变换)特征提取的去重算法、基于机器学习的去重算法等。基于orb提取局部二值特征点等算法,虽然提取特征的速度很快,但是受图像之间的尺寸差异、形变等影响较大。基于sift的特征提取去重算法虽然效果较好,但是计算速度受制于特征提取和特征匹配计算的复杂度,同时对于翻转等操作后的图像特征提取效果较差。基于机器学习的去重算法,需要大量数据和时间进行训练,且去重效果依赖于训练结果,实际应用效果差。
6、目前现有的图像去重算法大多都是在仅有一张重复图像的情况下进行去重,对于有多张重复图像的情况下,并不能很好的处理,即使处理也只对后面重复的多张图像与第一张进行比较,忽略了多张重复图像相互之间的相关性,以至于相似图像的查询有遗漏,或者不准确。
技术实现思路
1、鉴于上述存在的问题,提出了本专利技术。
2、因此,本专利技术解决的技术问题是:现有的图像去重方法存在对多张重复图像处理不足,特征提取效率与精度受限,相似度计算与聚类分析效率低,以及如何实现高效图像特征提取及相似度计算的优化问题。
3、为解决上述技术问题,本专利技术提供如下技术方案:基于多层特征融合和改进相似度聚类图像去重方法,包括对输入图像进行第一特征提取,生成索引;根据特征向量,获得图像相似度;读入索引,对图像进行第一分析。
4、作为本专利技术所述的基于多层特征融合和改进相似度聚类图像去重方法的一种优选方案,其中:所述对输入图像进行第一特征提取包括对输入图像进行特征提取,得到特征向量。
5、作为本专利技术所述的基于多层特征融合和改进相似度聚类图像去重方法的一种优选方案,其中:所述生成索引包括生成文件名加特征的索引。
6、作为本专利技术所述的基于多层特征融合和改进相似度聚类图像去重方法的一种优选方案,其中:所述根据特征向量包括读入特征向量。
7、作为本专利技术所述的基于多层特征融合和改进相似度聚类图像去重方法的一种优选方案,其中:所述获得图像相似度包括综合各分量相似度。
8、作为本专利技术所述的基于多层特征融合和改进相似度聚类图像去重方法的一种优选方案,其中:所述读入索引包括读入文件名加特征的索引。
9、作为本专利技术所述的基于多层特征融合和改进相似度聚类图像去重方法的一种优选方案,其中:所述对图像进行第一分析包括得到图像聚类结果。
10、本专利技术的另外一个目的是提供一种基于多层特征融合和改进相似度聚类图像去重系统,其能通过相似度计算模块根据特征向量,采用分层比较方法计算图像之间的相似度,解决了目前的相似度计算开销大,效率低,易受噪声或细微变化干扰的问题。
11、作为本专利技术所述的基于多层特征融合和改进相似度聚类图像去重系统的一种优选方案,其中:包括特征提取模块、相似度计算模块、聚类分析模块;所述特征提取模块用于对输入图像进行第一特征提取,生成索引;所述相似度计算模块用于根据特征向量,获得图像相似度;所述聚类分析模块用于读入索引,对图像进行第一分析。
12、一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序是实现基于多层特征融合和改进相似度聚类图像去重方法的步骤。
13、一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现基于多层特征融合和改进相似度聚类图像去重方法的步骤。
14、本专利技术的有益效果:本专利技术提供的基于多层特征融合和改进相似度聚类图像去重方法通过利用三层小波包分解和两层小波包分解,分别提取图像的主要特征和细节特征,并将特征结合形成三维向量,提高了特征表达能力和抗干扰能力,通过优先匹配主要特征,提升了计算效率,并降低了因噪声或微小变化导致的误判风险,通过将相似度结果抽象为样本之间的距离,进行无监督聚类分析,提高了重复图像去除的全面性和可靠性,本专利技术在抗干扰、计算效率和可靠性方面都取得更加良好的效果。
本文档来自技高网...【技术保护点】
1.基于多层特征融合和改进相似度聚类图像去重方法,其特征在于,包括:
2.如权利要求1所述的基于多层特征融合和改进相似度聚类图像去重方法,其特征在于:所述对输入图像进行第一特征提取包括对输入图像进行特征提取,得到特征向量。
3.如权利要求2所述的基于多层特征融合和改进相似度聚类图像去重方法,其特征在于:所述生成索引包括生成文件名加特征的索引。
4.如权利要求3所述的基于多层特征融合和改进相似度聚类图像去重方法,其特征在于:所述根据特征向量包括读入特征向量。
5.如权利要求4所述的基于多层特征融合和改进相似度聚类图像去重方法,其特征在于:所述获得图像相似度包括综合各分量相似度。
6.如权利要求5所述的基于多层特征融合和改进相似度聚类图像去重方法,其特征在于:所述读入索引包括读入文件名加特征的索引。
7.如权利要求6所述的基于多层特征融合和改进相似度聚类图像去重方法,其特征在于:所述对图像进行第一分析包括得到图像聚类结果。
8.一种采用如权利要求1~7任一所述的基于多层特征融合和改进相似度聚类图像去重
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的基于多层特征融合和改进相似度聚类图像去重方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的基于多层特征融合和改进相似度聚类图像去重方法的步骤。
...【技术特征摘要】
1.基于多层特征融合和改进相似度聚类图像去重方法,其特征在于,包括:
2.如权利要求1所述的基于多层特征融合和改进相似度聚类图像去重方法,其特征在于:所述对输入图像进行第一特征提取包括对输入图像进行特征提取,得到特征向量。
3.如权利要求2所述的基于多层特征融合和改进相似度聚类图像去重方法,其特征在于:所述生成索引包括生成文件名加特征的索引。
4.如权利要求3所述的基于多层特征融合和改进相似度聚类图像去重方法,其特征在于:所述根据特征向量包括读入特征向量。
5.如权利要求4所述的基于多层特征融合和改进相似度聚类图像去重方法,其特征在于:所述获得图像相似度包括综合各分量相似度。
6.如权利要求5所述的基于多层特征融合和改进相似度聚类图像去重方法,其特征在于:所述读入...
【专利技术属性】
技术研发人员:张丽娟,黄薇娴,张逸彬,
申请(专利权)人:云南电网有限责任公司信息中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。