System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于相似度的标识识别方法和系统技术方案_技高网

一种基于相似度的标识识别方法和系统技术方案

技术编号:40028577 阅读:7 留言:0更新日期:2024-01-16 17:52
本申请公开了一种基于相似度的标识识别方法和系统,通过获取目标数量图片数据,对所述图片数据进行人工标注类别框,利用yolov5框架进行标识检测模型训练,基于人工标注后的目标数量图片数据裁剪出相应的标识图片,并利用训练好的标识检测模型对包含标识的图片进行检测和裁剪,得到预设数量的兴趣区域子图,采用SimCLR自监督对比学习对所述标识图片进行特征学习,学习到所述标识图片的特征表示;创建标识库,所述标识库用于存储和匹配标识的特征信息;通过所述标识库对原始图片进行检测和特征匹配,返回相似度超过阈值的标识图片。所述标识库可以快速对任意标识类目进行增减操作的更新,大大减少了人工标注成本、时间成本和机器成本。

【技术实现步骤摘要】

本申请涉及基于相似度的标识识别,特别是涉及一种基于相似度的标识识别方法和系统


技术介绍

1、在互联网场景中,交友聊天、游戏娱乐和媒体互动等泛娱乐领域之间的竞争日益激烈,致使竞品之间商标标识的相互屏蔽出现缺口,加之互联网大环境下恶意的广告logo,涉政违禁的标识屡见不鲜,因此屏蔽或跟踪特定场景下的标识标记是必要的。

2、现有的标识识别方案通常包括一阶段目标检测识别方法和二阶段目标检测+图像分类的识别方法,无论是一阶段或是二阶段,识别的物体类目都是一个预先定义好的有限的闭集,不足以涵盖互联网中日益新增的的标识标记,这无疑会增加新增类目的人工标注成本和反复训练的时间与机器成本。同时,随着目标类目的不断增多,数据分布不均导致的长尾问题会对模型性能造成较大影响。


技术实现思路

1、本申请提供一种基于相似度的标识识别方法和系统,旨在解决现有标识识别方案人工标注成本和反复训练的时间与机器成本过高的问题。

2、第一方面,一种基于相似度的标识识别方法,所述方法包括:

3、获取目标数量图片数据,对所述图片数据进行人工标注类别框,利用yolov5框架进行标识检测模型训练;

4、基于人工标注后的目标数量图片数据裁剪出相应的标识图片,并利用训练好的标识检测模型对包含标识的图片进行检测和裁剪,得到预设数量的兴趣区域子图;

5、采用simclr自监督对比学习对所述标识图片进行特征学习,学习到所述标识图片的特征表示;

6、创建标识库,所述标识库用于存储和匹配标识的特征信息;

7、通过所述标识库对原始图片进行检测和特征匹配,返回相似度超过阈值的标识图片。

8、上述方案中,可选地,所述利用yolov5框架进行标识检测模型训练,包括:

9、利用yolov5框架进行标识检测模型的训练,其中,使用yolov5-p6(m)检测模型,模型包含输出层p3/p4/p5/p6,对应步长为8/16/32/64,并增加了额外的p6/64输出层用于大目标的检测。

10、上述方案中,可选地,所述采用simclr自监督对比学习对所述标识图片进行特征学习,学习到所述标识图片的特征表示,具体包括:

11、对裁剪后的标识图片进行数据增强;

12、使用共享的cnn backbone提取数据增强后的图片特征;

13、通过projection head进一步提取特征,将特征降维到512维;

14、使用相似度度量来衡量同一张原始图片经过不同数据增强后得到的相似图片;

15、使用nt-xent损失函数最大化相似图片的相似度,学习到通用的特征表达作为所述标识图片的特征表示。

16、上述方案中,进一步可选的,所述使用共享的cnn backbone提取数据增强后的图片特征,通过projectionhead进一步提取特征,将特征降维到512维,具体包括:

17、将数据数据增强后的图片输入参数共享的cnnbackbone得到所有数据的图片表征,并通过projection head进一步提取图片特征,projection head具体结构表达式如下:

18、fi=g(hi)=w(2)σ(w(1)hi);

19、其中,hi为cnnbackbone提取的图片表征。

20、上述方案中,进一步可选的,所述使用相似度度量来衡量同一张原始图片经过不同数据增强后得到的相似图片,使用nt-xent损失函数最大化相似图片的相似度,学习到通用的特征表达作为所述标识图片的特征表示,具体包括:

21、图片特征之间的相似度度量使用余弦相似度:representation similarity=cosine similarity,定义为:,

22、

23、其中,z为提取的图片特征,τ为可调节的temperature参数,对输入进行伸缩并扩展余弦相似度至[-1,1]范围;

24、simclr采用nt-xent loss,使用softmax函数使两个图像特征的相似度sij概率化,并取负对数来最大化softmax的相似度概率,定义为:

25、

26、对同一对图片交换位置以后计算损失:

27、

28、上述方案中,进一步可选的,所述对裁剪后的标识图片进行数据增强,包括:随机裁剪之后再重采样至原来的大小;随机色彩失真;旋转一定角度;随机高斯模糊,其中,随机裁剪后的图像面积大于原图的85%。

29、上述方案中,可选地,所述创建标识库,所述标识库用于存储和匹配标识的特征信息,包括:

30、创建标识库,用于动态匹配实时需求,所述标识库中存储了repvgg-b3g4提取的512维特征矩阵,在本地和gpu/cpu设备中同步标识库的特征矩阵,当需要增删操作时,对本地特征矩阵进行相应的增删,同步至gpu/cpu设备完成更新。

31、上述方案中,可选地,所述通过所述标识库对原始图片进行检测和特征匹配,返回相似度超过阈值的标识图片,具体为:

32、将待预测的原始图片重采样至固定分辨率;

33、使用标识检测模型检测并获取标识的兴趣区域,然后裁剪出所有兴趣区域对应的子图;

34、将裁剪后的标识子图重采样至另一固定分辨率;

35、使用repvgg-b3g4提取标识子图的图片特征,并进行归一化处理;

36、通过余弦相似度计算标识子图特征与标识库中所有图片特征的相似度;

37、响应相似度超过预设阈值的图片,并返回对应的原始图片作为识别结果。

38、第二方面,一种基于相似度的标识识别系统,所述系统包括:

39、获取模块:用于获取目标数量图片数据,对所述图片数据进行人工标注类别框,利用yolov5框架进行标识检测模型训练;

40、裁剪模块:用于基于人工标注后的目标数量图片数据裁剪出相应的标识图片,并利用训练好的标识检测模型对包含标识的图片进行检测和裁剪,得到预设数量的兴趣区域子图;

41、特征提取模块:用于采用simclr自监督对比学习对所述标识图片进行特征学习,学习到所述标识图片的特征表示;

42、标识库模块:用于创建标识库,所述标识库用于存储和匹配标识的特征信息;

43、识别模块:用于通过所述标识库对原始图片进行检测和特征匹配,返回相似度超过阈值的标识图片。

44、相比现有技术,本申请至少具有以下有益效果:

45、本申请基于对现有技术问题的进一步分析和研究,认识到现有标识识别方案人工标注成本和反复训练的时间与机器成本过高的问题。

46、本方案通过获取目标数量图片数据,对所述图片数据进行人工标注类别框,利用yolov5框架进行标识检测模型训练,基于人工标注后的目标数量图片数据裁剪出相应的标识图片,并利用训练好的标识检测模型本文档来自技高网...

【技术保护点】

1.一种基于相似度的标识识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述利用yolov5框架进行标识检测模型训练,包括:

3.根据权利要求1所述的方法,其特征在于,所述采用SimCLR自监督对比学习对所述标识图片进行特征学习,学习到所述标识图片的特征表示,具体包括:

4.根据权利要求3所述的方法,其特征在于,所述使用共享的CNN backbone提取数据增强后的图片特征,通过Projection head进一步提取特征,将特征降维到512维,具体包括:

5.根据权利要求3所述的方法,其特征在于,所述使用相似度度量来衡量同一张原始图片经过不同数据增强后得到的相似图片,使用NT-Xent损失函数最大化相似图片的相似度,学习到通用的特征表达作为所述标识图片的特征表示,具体包括:

6.根据权利要求3所述的方法,其特征在于,所述对裁剪后的标识图片进行数据增强,包括:随机裁剪之后再重采样至原来的大小;随机色彩失真;旋转一定角度;随机高斯模糊,其中,随机裁剪后的图像面积大于原图的85%。

>7.根据权利要求1所述的方法,其特征在于,所述创建标识库,所述标识库用于存储和匹配标识的特征信息,包括:

8.根据权利要求1所述的方法,其特征在于,所述通过所述标识库对原始图片进行检测和特征匹配,返回相似度超过阈值的标识图片,具体为:

9.一种基于相似度的标识识别系统,其特征在于,包括:

...

【技术特征摘要】

1.一种基于相似度的标识识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述利用yolov5框架进行标识检测模型训练,包括:

3.根据权利要求1所述的方法,其特征在于,所述采用simclr自监督对比学习对所述标识图片进行特征学习,学习到所述标识图片的特征表示,具体包括:

4.根据权利要求3所述的方法,其特征在于,所述使用共享的cnn backbone提取数据增强后的图片特征,通过projection head进一步提取特征,将特征降维到512维,具体包括:

5.根据权利要求3所述的方法,其特征在于,所述使用相似度度量来衡量同一张原始图片经过不同数据增强后得到的相似图片...

【专利技术属性】
技术研发人员:姜孟源周吴夏朗杜晓祥
申请(专利权)人:北京云上曲率科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1