【技术实现步骤摘要】
图像去重方法、终端设备以及计算机存储介质
[0001]本申请涉及图像处理
,特别是涉及一种图像去重方法、终端设备以及计算机存储介质。
技术介绍
[0002]图像数据库中存在大量内容相同或相似的图像,造成存储资源的浪费;在展示图像中显示过多重复的图像也较影响用户的体验;对于一些由数据驱动的算法(如神经网络等),过多的重复图像将增加算法训练的时间,且使最终训练结果存在偏差。传统的图像去重方法是对待去重图像两两进行相似度的匹配,若两张图像被认定为相似,则删除其中一张图像。整个过程耗费大量的时间,且随着数据规模的增大其在时间消耗和内存占用上也显著增加。
技术实现思路
[0003]本申请提供一种图像去重方法、终端设备以及计算机存储介质。
[0004]本申请采用的一个技术方案是提供一种图像去重方法,所述图像去重方法包括:
[0005]获取第一图像集;
[0006]按照图像索引表读取若干第二图像集,其中,所述图像索引表中的每一第二图像存在于其中一个第二图像集;
[0007]遍历每一第二 ...
【技术保护点】
【技术特征摘要】
1.一种图像去重方法,其特征在于,所述图像去重方法包括:获取第一图像集;按照图像索引表读取若干第二图像集,其中,所述图像索引表中的每一第二图像存在于其中一个第二图像集;遍历每一第二图像集,对所述第一图像集执行第一去重操作,以得到所述第一图像集去重后形成的第三图像集;所述第一去重操作包括:遍历所述第二图像集的每一第二图像,利用所述每一第二图像对所述第一图像集执行图像集更新操作;所述图像集更新操作包括:获取所述第二图像与所述第一图像集中所有第一图像的第一相似度,在存在所述第一相似度高于预设阈值时,将高于预设阈值的第一相似度对应的第一图像从所述第一图像集删除,以更新所述第一图像集。2.根据权利要求1所述的图像去重方法,其特征在于,所述获取第一图像集,包括:将所述第一图像集划分为若干第一图像子集,每一第一图像子集的任意一个第一图像不存在于其他第一图像子集;将每两个所述第一图像子集确定为一组图像子集,对每一组图像子集执行第二去重操作,获取每一组图像子集合并形成的第三图像子集,每个所述第三图像子集中包含的任意两个第一图像的相似度低于第二预设阈值;所述第二去重操作包括:选取所述图像子集中第一目标图像子集的第一目标图像,对所述第一目标图像子集执行图像子集更新操作;所述图像子集更新操作包括:基于所述第一目标图像与所述图像子集中第一非目标图像子集的所有第一非目标图像的第二相似度,将所述第二相似度高于所述预设阈值的第一目标图像从所述第一目标图像子集中删除,更新所述第一目标图像子集;继续选取所述图像子集中未选取过的第一目标图像执行所述图像子集更新操作,直至所述第一目标图像子集内所有第一目标图像遍历完成。3.根据权利要求2所述的图像去重方法,其特征在于,所述获取每一组图像子集合并形成的第三图像子集之后,所述图像去重方法还包括:获取所述第三图像子集的数量;在所述第三图像子集的数量为1时,输出所述第三图像子集;在所述第三图像子集的数量大于1时,将每两个所述第三图像子集确定为一组图像子集,对每一组图像子集执行所述第二去重操作,直至每一组图像子集合并形成的第三图像子集的数量为1。4.根据权利要求2所述的图像去重方法,其特征在于,所述将所述第一图像集划分为若干第一图像子集之后,所述图像去重方法还包括:对每一第一图像子集执行第三去重操作,以更新每一第一图像子集;所述第三去重操作包括:选取所述第一图像子集的一个第一子图像,执行集间去重操作;
所述集间去重操作包括:获取所述第一子图像与其他第一子图像的第三相似度,将所述第三相似度高于所述预设阈值的第一子图像从所述第一图像子集中删除;继续选取所述第一图像子集中未被选取的一个第一子图像,执行集间去重操作,直至所述第一图像子集内第一子图像选取完成,其中,未被选取的第一子图像包括所述图像子集内匹配的第三相似度低于所述预设阈值的第一子图像。5.根据权利要求1所述的图像去重方法,其特征在于,所述图像去重方法,还包括:利用所述第三图...
【专利技术属性】
技术研发人员:尚守望,周祥明,吴立,黄鹏,张朋,蔡丹平,郑春煌,
申请(专利权)人:浙江大华技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。