多张图片之间重复内容获取方法、系统、设备和介质技术方案

技术编号:24576998 阅读:44 留言:0更新日期:2020-06-21 00:31
本公开涉及图像处理技术领域,特别涉及一种多张图片之间重复内容获取方法、系统、设备和存储介质。所述方法通过构建包含多张训练图片的训练数据集,并利用训练数据集训练好一个能够检测和判别到多张训练图片中标记区域以及标记区域之间是否相同的模型,继而利用训练好的这个模型判别目标图片中被检测出来的的标记区域是否相同,最终依据检测出来的标记区域和判别结果快速找到目标图片之间的重复内容。

Methods, systems, devices, and media for obtaining duplicate content among multiple images

【技术实现步骤摘要】
多张图片之间重复内容获取方法、系统、设备和介质
本公开涉及图像处理
,特别涉及一种多张图片之间重复内容获取方法、系统、设备和存储介质。
技术介绍
相机的成像范围可以通过不同的镜头来达到不同的效果。不过,当相机面临的取景区域面积较大,或者相机距离取景区域较近时,不论换成何种镜头,相机的成像范围总是难以完全覆盖取景区域。为了完全覆盖取景区域,不得不采用布设多组相机或者使用同一相机拍摄多张照片的方式来实现。布设多组相机还是采用同一相机拍摄多张照片,最终的结果都是会产生多张图片。而对于完整的取景区域来说,只有把产生的多张图片进行拼接才能得到完整的取景区域。显然在拼接这些图片时需要考虑图片之间重复内容进行重叠才能实现图片的正确拼接。在零售行业中,利用相机拍摄货柜上的货物图片,并利用人工智能技术去识别图像中不同的货物区域,最终形成关于货物售卖情况报表的方式正逐步得到应用。由于清晰度等客观要求的限制,拍摄多张货柜图像成为必要的步骤。如果想要利用这些图像拼接出一份完整的货柜图像,还需要利用人工识别出多张图像之间的重复内容,以便于做到精确拼接。
技术实现思路
本公开的一方面提供了一种获取多张图片之间重复内容的方法。所述方法包括如下步骤:对多张训练图片进行区域标记,以得到包含有由多个标记框圈定的标记区域的训练数据集;其中所述标记区域之间建立有关联关系,并且不同的标记区域之间的关联关系不同于相同的所述标记区域之间的关联关系;将所述训练数据集输入模型中进行训练,以得到能够检测出所述标记区域,并且能够判别每两个所述标记区域之间是否相同的检测分类模型;将目标图片输入至所述检测分类模型中,以在检测出所述目标图片中的所述标记区域,并判别每两个所述标记区域之间是否相同后输出判别结果;依据检测出的所述目标图片中的所述标记区域,以及所述判别结果,得到所述目标图片中的重复内容。在一实施例中,所述对多张训练图片进行区域标记,以得到包含有由多个标记框圈定的标记区域的训练数据集;其中所述标记区域之间建立有关联关系,并且不同内容的标记区域之间的关联关系不同于相同内容的所述标记区域之间的关联关系步骤包括:在多张所述训练图片上标记出能够覆盖所述训练图片的多个标记框,以形成带有标记框的一训练集;其中多个所述标记框在所述训练图片上间隔分布;获取所述训练集中的所述标记区域,并在所述标记区域之间建立关联关系,其中不同内容的标记区域之间的关联关系不同于相同内容的所述标记区域之间的关联关系。在一实施例中,所述在多张训练图片上标记出能够覆盖训练图片的多个标记框,以形成带有标记框的训练集的步骤包括:获取多张所述训练图片;利用人工标记的方式将多个所述标记框间隔标记在所述训练图片上,得到所述训练集。在一实施例中,所述获取所述训练集中的所述标记区域,并在所述标记区域之间建立关联关系的步骤包括:利用人工确定所述训练集中的相同的标记区域;建立标记区域之间的关联关系;利用所述训练集中的所述标记区域和所述关联关系形成所述训练数据集。在一实施例中,所述将训练数据集输入模型中进行训练,以得到能够检测出所述标记区域并且能够判别每两个所述标记区域之间是否相同的检测分类模型的步骤包括:将所述训练集输入一模型中进行训练,以得到能够检测出所述标记区域的标记区域检测模型;将所述训练数据集输入另一模型中进行训练,以得到能够判别所述标记区域是否相同的标记区域分类模型。在一实施例中,所述将目标图片输入至检测分类模型中,以在检测出目标图片中的所述标记区域,并判别每两个所述标记区域之间是否相同后输出判别结果的步骤包括:将所述目标图片输入所述标记区域检测模型中,以检测出所述目标图片中的所述标记区域;将所述目标图片的所述标记区域输入所述标记区域分类模型中,以得到每两个所述标记区域之间是否的判定结果。在一实施例中,所述一训练模型为MaskR-CNN模型、FasterR-CNN模型、YOLO模型或SSD模型。本公开的另一方面是提供了一种多张图片之间重复内容获取系统。所述多张图片之间重复区域获取系统用于实现如前所述的多张图片之间重复内容获取方法的步骤。所述多张图片之间重复内容获取系统包括:数据获取模块,用于对多张训练图片进行区域标记,以得到包含有由多个标记框圈定的标记区域的训练数据集;其中所述标记区域之间建立有关联关系,并且不同内容的标记区域之间的关联关系不同于相同内容的所述标记区域之间的关联关系;模型训练模块,用于将所述训练数据集输入模型中进行训练,以得到能够检测出所述标记区域并且能够判别每两个所述标记区域之间是否相同的检测分类模型;图片识别模块,用于将目标图片输入至所述检测分类模型中,以在检测出所述目标图片中的所述标记区域,并判别每两个所述标记区域之间是否相同后输出判别结果;并且依据检测出的所述目标图片中的所述标记区域,以及所述判别结果,得到所述目标图片中的相同标记区域。本公开的再一方面还提供了一种多张图片之间重复内容获取设备。所述多张图片之间重复内容获取设备包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如本公开前一方面所述的多张图片之间重复内容获取方法的步骤。本公开的最后一方面则是提供了一种计算机可读存储介质。所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前所述的多张图片之间重复内容获取方法的步骤。在本公开提供的多张图片之间重复内容获取方法、系统、设备和存储介质中,通过构建包含多张训练图片的训练数据集,并利用训练数据集训练好一个能够检测和判别到多张训练图片中标记区域以及标记区域之间是否相同的模型,继而利用训练好的这个模型判别目标图片中被检测出来的的标记区域是否相同,最终依据检测出来的标记区域和判别结果快速找到目标图片之间的重复内容。另一方面,本公开还可以利用标记框尽可能多地将重复内容标记出来,从而保证了最大范围的相同的内容可以被识别出来。再一方面,本公开还利用人工标记的方式来制作训练数据集,从而大大提高了训练结果的精确度。最后,本公开还分别利用不同的训练模型分别进行训练,进而通过两个训练好的模型组合使用,最终达到识别目标图片中的重复内容的目的。附图说明附图示例性地示出了实施例并且构成说明书地一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于示例的目的,并不限制权利要求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。图1是本公开一实施例所展示的多张图片之间重复内容获取方法的步骤流程图;图2是本公开一实施例提供的优选的多张图片之间重复内容获取方法的步骤流程图;图3是本公开一实施例提供的标记框的方向设置示意图;图4是本公开一实施例提供的优选的标记框的标记方法步骤流程图;图5是本公开一实本文档来自技高网...

【技术保护点】
1.一种多张图片之间重复内容获取方法,其特征在于,包括如下步骤:/n对多张训练图片进行区域标记,以得到包含有由多个标记框圈定的标记区域的训练数据集;其中所述标记区域之间建立有关联关系,并且不同的标记区域之间的关联关系不同于相同的所述标记区域之间的关联关系;/n将所述训练数据集输入模型中进行训练,以得到能够检测出所述标记区域,并且能够判别每两个所述标记区域之间是否相同的检测分类模型;/n将目标图片输入至所述检测分类模型中,以在检测出所述目标图片中的所述标记区域,并判别每两个所述标记区域之间是否相同后输出判别结果;/n依据检测出的所述目标图片中的所述标记区域,以及所述判别结果,得到所述目标图片中的重复内容。/n

【技术特征摘要】
1.一种多张图片之间重复内容获取方法,其特征在于,包括如下步骤:
对多张训练图片进行区域标记,以得到包含有由多个标记框圈定的标记区域的训练数据集;其中所述标记区域之间建立有关联关系,并且不同的标记区域之间的关联关系不同于相同的所述标记区域之间的关联关系;
将所述训练数据集输入模型中进行训练,以得到能够检测出所述标记区域,并且能够判别每两个所述标记区域之间是否相同的检测分类模型;
将目标图片输入至所述检测分类模型中,以在检测出所述目标图片中的所述标记区域,并判别每两个所述标记区域之间是否相同后输出判别结果;
依据检测出的所述目标图片中的所述标记区域,以及所述判别结果,得到所述目标图片中的重复内容。


2.如权利要求1所述的多张图片之间重复内容获取方法,其特征在于,所述对多张训练图片进行区域标记,以得到包含有由多个标记框圈定的标记区域的训练数据集;其中所述标记区域之间建立有关联关系,并且不同内容的标记区域之间的关联关系不同于相同内容的所述标记区域之间的关联关系步骤包括:
在多张所述训练图片上标记出能够覆盖所述训练图片的多个标记框,以形成带有标记框的一训练集;其中多个所述标记框在所述训练图片上间隔分布;
获取所述训练集中的所述标记区域,并在所述标记区域之间建立关联关系,其中
不同内容的标记区域之间的关联关系不同于相同内容的所述标记区域之间的关联关系。


3.如权利要求2所述多张图片之间重复内容获取方法,其特征在于,所述在多张训练图片上标记出能够覆盖训练图片的多个标记框,以形成带有标记框的训练集的步骤包括:
获取多张所述训练图片;
利用人工标记的方式将多个所述标记框间隔标记在所述训练图片上,得到所述训练集。


4.如权利要求2所述的多张图片之间重复内容获取方法,其特征在于,所述获取所述训练集中的所述标记区域,并在所述标记区域之间建立关联关系的步骤包括:
利用人工确定所述训练集中的相同的标记区域;
建立标记区域之间的关联关系;
利用所述训练集中的所述标记区域和所述关联关系形成所述训练数据集。


5.如权利要求2所述的多张图片之间重复内容获取方法,其特征在于,所述将训练数据集输入模型中进行训练,以得到能够检测出所述标记区域并且能够判别每两个所述标记区域之间是否相同的...

【专利技术属性】
技术研发人员:张雨露李佩钊童星
申请(专利权)人:上海扩博智能技术有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1