重复图像识别方法、装置、设备、存储介质及程序产品制造方法及图纸

技术编号:37492844 阅读:22 留言:0更新日期:2023-05-07 09:31
本申请实施例提供了一种重复图像识别方法、装置、设备、存储介质及程序产品,该方法包括:获取至少两张待识别图像,将所述待识别图像输入至预先训练完成的特征识别模型,得到每个所述待识别图像对应的待比对特征,其中,所述特征识别模型采用自监督训练方式,基于设置的第一损失函数和第二损失函数进行训练得到;根据所述待比对特征确定所述待识别图像之间的图像相似度;根据所述图像相似度确定所述待识别图像中的重复图像。本方案适用于多种不同的使用场景,无需额外的数据标注操作,降低了重复图像识别的成本开销。重复图像识别的成本开销。重复图像识别的成本开销。

【技术实现步骤摘要】
重复图像识别方法、装置、设备、存储介质及程序产品


[0001]本申请实施例涉及图像识别
,尤其涉及一种重复图像识别方法、装置、设备、存储介质及程序产品。

技术介绍

[0002]随着多媒体技术的发展,创作者通过创作具有自主知识产权的多媒体信息在网络媒体传播,以供浏览者观看。但是存在部分创作者进行信息的复制,进而导致大量重复内容在平台传播。
[0003]相关技术中,为了实现对重复图像内容的检测,大多采用基于哈希指纹或采用有监督的图像检索方式进行重复图像识别。其中,采用基于哈希指纹的方式,其图像识别场景相对受限,如针对图像内容的形变和添加噪声的重复图像检测精度较差,而采用有监督的图像检索方式,其需要额外标注的数据,同时其使用的模型的质量更取决于标注数据的数量和质量,因此导致了整体成本过高的问题。

技术实现思路

[0004]本申请实施例提供了一种重复图像识别方法、装置、设备、存储介质及程序产品,解决了相关技术中在进行重复图像识别时场景受限的问题,无需额外的数据标注操作,降低了重复图像识别的成本开销。r/>[0005]第本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.重复图像识别方法,其特征在于,包括:获取至少两张待识别图像,将所述待识别图像输入至预先训练完成的特征识别模型,得到每个所述待识别图像对应的待比对特征,其中,所述特征识别模型采用自监督训练方式,基于设置的第一损失函数和第二损失函数进行训练得到;根据所述待比对特征确定所述待识别图像之间的图像相似度;根据所述图像相似度确定所述待识别图像中的重复图像。2.根据权利要求1所述的重复图像识别方法,其特征在于,在所述获取至少两张待识别图像之前,还包括:获取图片训练集,对所述图片训练集中的图片进行分组得到分组训练集;对所述分组训练集中的每张图片进行随机信息增强得到增强图片集,所述随机信息增强包括随机文字增强和/或随机表情增强;基于所述增强图片集对待训练的特征识别模型进行自监督训练,得到训练完成的特征识别模型。3.根据权利要求2所述的重复图像识别方法,其特征在于,所述基于所述增强图片集对待训练的特征识别模型进行自监督训练,包括:将所述增强图片集输入至卷积神经网络中,得到每张图片对应的第一图片特征,所述卷积神经网络的最后一层为广义平均池化层;通过设置的线性层将所述第一图片特征映射为第二图片特征;基于设置的第一损失函数和第二损失函数进行所述第二图片特征的优化以得到训练完成的卷积神经网络。4.根据权利要求3所述的重复图像识别方法,其特征在于,所述第一损失函数的表达式为:其中,P为增强图片集,s
i,j
=sim(z
i
,z
j
)/τ,z
i
,z
j
为第二图片特征,τ为温度系数。5.根据权利要求3所述的重复图像识别方法,其特征在于,所述第二损失函数的表达式为:其中,P为增强图片集,N为所述增...

【专利技术属性】
技术研发人员:眭哲豪
申请(专利权)人:百果园技术新加坡有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1