System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 网页图片的资产归属识别方法、装置、设备以及存储介质制造方法及图纸_技高网

网页图片的资产归属识别方法、装置、设备以及存储介质制造方法及图纸

技术编号:40136221 阅读:4 留言:0更新日期:2024-01-23 22:54
本公开的实施例提供了网页图片的资产归属识别方法、装置、设备以及存储介质,应用于图像识别技术领域。所述方法包括获取待识别图片;将所述待识别图片输入预先训练的商标提取模型,输出对应的商标区域图片;将所述商标区域图片在预设特征图片库中进行匹配,将匹配到的特征图片作为目标特征图片;将所述目标特征图片的资产归属作为所述待识别图片的资产归属。以此方式,可以大幅度减少图片背景干扰,提高图片的资产归属的识别精确度,降低漏识别率,时效性高,可解释性强,减少后期人工核对过程。

【技术实现步骤摘要】

本公开涉及图像识别,尤其涉及网页图片的资产归属识别方法、装置、设备以及存储介质


技术介绍

1、目前资产识别中的网页图片识别,主要通过提取整张图片特征与图片特征库进行比对识别。实际情况中,网页图片内容的多样性和不可预测性,以及存在背景干扰等问题,导致目前的技术识别效果在存在背景干扰的情况下,效果不好。虽然可以通过提高置信度,减少背景干扰,但同时也大幅降低了查全率,导致漏识别率提高。而使用ocr(opticalcharacter recognition,简称ocr)文本比对技术,网页图片中存在企业名称的缩写简称,以及包含父公司、子公司名字的情况,ocr文本比对存在误匹配的情况。

2、所以,亟需一种准确度更高的网页图片的资产归属识别方法。


技术实现思路

1、本公开提供了一种网页图片的资产归属识别的方法、装置、设备以及存储介质。

2、根据本公开的第一方面,提供了一种网页图片的资产归属识别方法。

3、该方法包括:

4、获取待识别图片;

5、将所述待识别图片输入预先训练的商标提取模型,输出对应的商标区域图片;

6、将所述商标区域图片在预设特征图片库中进行匹配,将匹配到的特征图片作为目标特征图片;

7、将所述目标特征图片的资产归属作为所述待识别图片的资产归属。

8、如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述商标提取模型是通过以下步骤训练得到的:

9、对历史网页图片进行商标区域标注及商标区域文字遮掩处理,得到遮掩打标数据集;

10、使用所述遮掩打标数据集对yolov7模型进行训练;

11、达到预设训练轮次时,计算yolov7模型的map值;

12、当所述map值大于等于预设阈值时,停止训练;

13、将训练完成的yolov7模型作为商标提取模型。

14、如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述将所述商标区域图片在预设特征图片库中进行匹配,将匹配到的特征图片作为目标特征图片,包括:

15、分别计算所述商标区域图片与特征图片库中各特征图片之间的欧氏距离;

16、根据所述欧氏距离,确定初始特征图片;

17、计算所述商标区域图片与所述初始特征图片之间的第一相似度;

18、根据所述第一相似度,确定目标特征图片;其中所述目标特征图片为所述第一相似度大于等于第一预设相似值的初始特征图片中的最大第一相似度对应的特征图片。

19、如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述分别计算所述商标区域图片与特征图片库中各特征图片之间的欧氏距离,包括:

20、使用resnet52神经网络模型分别提取所述商标区域图片和所述特征图片库中各特征图片的特征向量;

21、分别计算所述商标区域图片的特征向量与各特征图片的特征向量之间的欧氏距离,作为所述商标区域图片与特征图片库中各特征图片之间的欧氏距离。

22、如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述计算所述商标区域图片与所述初始特征图片之间的第一相似度,包括:

23、基于sift算法,计算所述商标区域图片与所述初始特征图片之间的关键点匹配数目,作为第一相似度。

24、如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述方法还包括:

25、响应于所述第一相似度小于所述第一预设相似值,根据所述待识别图片与特征图片库重新确定初始特征图片,并计算所述待识别图片与所述初始特征图片之间的第二相似度;

26、响应于所述第二相似度大于等于所述第一预设相似值,对所述待识别图片与所述初始特征图片进行文本提取;

27、根据提取到的文本,计算所述待识别图片与所述初始特征图片之间的第三相似度;

28、响应于所述第三相似度大于等于第二预设相似值,将所述初始特征图片作为目标特征图片。

29、如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据提取到的文本,计算所述待识别图片与所述初始特征图片之间的第三相似度,包括:

30、求所述待识别图片的文本与所述初始特征图片的文本之间的交并集比值:

31、将所述交并集比值作为第三相似度。

32、根据本公开的第二方面,提供了一种网页图片的资产归属识别装置。

33、该装置包括:

34、图片获取模块,用于获取待识别图片;

35、商标提取模块,用于将所述待识别图片输入预先训练的商标提取模型,输出对应的商标区域图片;

36、特征匹配模块,用于将所述商标区域图片在预设特征图片库中进行匹配,将匹配到的特征图片作为目标特征图片;

37、资产归属模块,用于将所述目标特征图片的资产归属作为所述待识别图片的资产归属。

38、根据本公开的第三方面,提供了一种电子设备。该电子设备包括:存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如以上所述的方法。

39、根据本公开的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如根据本公开的第一方面所述的方法。

40、本公开的实施例提供了网页图片的资产归属识别方法、装置、设备以及存储介质,通过将待识别图片输入预先训练的商标提取模型,输出对应的商标区域图片;将商标区域图片在预设特征图片库中进行匹配,将匹配到的特征图片作为目标特征图片;将目标特征图片的资产归属作为待识别图片的资产归属。以此方式,可以大幅度减少图片背景干扰,提高图片的资产归属的识别精确度,降低漏识别率,时效性高,可解释性强,减少后期人工核对过程。

41、应当理解,
技术实现思路
部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。

本文档来自技高网...

【技术保护点】

1.一种网页图片的资产归属识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述商标提取模型是通过以下步骤训练得到的:

3.根据权利要求1所述的方法,其特征在于,所述将所述商标区域图片在预设特征图片库中进行匹配,将匹配到的特征图片作为目标特征图片,包括:

4.根据权利要求3所述的方法,其特征在于,所述分别计算所述商标区域图片与特征图片库中各特征图片之间的欧氏距离,包括:

5.根据权利要求3所述的方法,其特征在于,所述计算所述商标区域图片与所述初始特征图片之间的第一相似度,包括:

6.根据权利要求3所述的方法,其特征在于,所述方法还包括:

7.根据权利要求6所述的方法,其特征在于,所述根据提取到的文本,计算所述待识别图片与所述初始特征图片之间的第三相似度,包括:

8.一种网页图片的资产归属识别装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括:

10.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一权利要求所述的方法。

...

【技术特征摘要】

1.一种网页图片的资产归属识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述商标提取模型是通过以下步骤训练得到的:

3.根据权利要求1所述的方法,其特征在于,所述将所述商标区域图片在预设特征图片库中进行匹配,将匹配到的特征图片作为目标特征图片,包括:

4.根据权利要求3所述的方法,其特征在于,所述分别计算所述商标区域图片与特征图片库中各特征图片之间的欧氏距离,包括:

5.根据权利要求3所述的方法,其特征在于,所述计算所述商标区域图片与所述初始...

【专利技术属性】
技术研发人员:陈刚李平肖成苏浩
申请(专利权)人:中通服创发科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1