一种目标识别方法、系统、电子设备和存储介质技术方案

技术编号:44924912 阅读:15 留言:0更新日期:2025-04-08 19:04
本发明专利技术公开了一种目标识别方法、系统、电子设备和存储介质,涉及图像识别技术领域,方法包括:构建目标识别模型,目标识别模型包括:编码器、解码器和检测头;编码器用于:利用卷积层和自注意力机制,获取样本图像在不同阶段的图像特征;解码器用于:对样本图像在不同阶段的图像特征进行渐进融合,对最终融合图像特征赋予不同权重,再进行特征增强操作,得到增强后的最终融合图像特征,检测头用于:对增强后的最终融合图像特征进行处理,得到样本图像的目标识别结果;对目标识别模型进行训练,得到训练好的目标识别模型;利用训练好的目标识别模型对预设图像进行识别,得到预设图像的目标识别结果。

【技术实现步骤摘要】

所属的技术人员知道,本专利技术可以实现为系统、方法或计算机程序产品,因此,本专利技术可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的软件(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“电路”、“模块”或“系统”。此外,在一些实施例中,本专利技术还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。尽管上面已经示出和描述了本专利技术的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本专利技术的限制,本领域的普通技术人员在本专利技术的范围内可以对上述实施例进行变化、修改、替换和变型。


技术介绍

1、在现实世界中,几乎所有领域都广泛应用着图像数据,在这些应用中,通常需要一定技术检测及确定最具视觉意义的目标数据。多模态文档图片中包含着大量非结构化信息,例如文本、表格和图像,这些信息常用于存储关键业务数据。多模态文档图片中通常包含多个小目标,这些小目标通常代表设备名称、技术参数、价格等关键信息,虽然体积较小,但其信息价值极高。通过提取这些目标,能够快速锁定文档中的本文档来自技高网...

【技术保护点】

1.一种目标识别方法,其特征在于,包括:

2.根据权利要求1所述的一种目标识别方法,其特征在于,所述解码器具体用于:利用膨胀卷积层、分块反向注意力机制模块和卷积层,对所述样本图像在不同阶段的图像特征进行渐进融合,对最终融合图像特征赋予不同权重,再进行特征增强操作,得到增强后的最终融合图像特征。

3.根据权利要求2所述的一种目标识别方法,其特征在于,所述编码器包括依次设置的第一卷积层、第一自注意力机制模块、第二自注意力机制模块和第三自注意力机制模块;第一自注意力机制模块、第二自注意力机制模块和第三自注意力机制模块用于通过自注意力机制对各个接收到的数据进行处理;...

【技术特征摘要】

1.一种目标识别方法,其特征在于,包括:

2.根据权利要求1所述的一种目标识别方法,其特征在于,所述解码器具体用于:利用膨胀卷积层、分块反向注意力机制模块和卷积层,对所述样本图像在不同阶段的图像特征进行渐进融合,对最终融合图像特征赋予不同权重,再进行特征增强操作,得到增强后的最终融合图像特征。

3.根据权利要求2所述的一种目标识别方法,其特征在于,所述编码器包括依次设置的第一卷积层、第一自注意力机制模块、第二自注意力机制模块和第三自注意力机制模块;第一自注意力机制模块、第二自注意力机制模块和第三自注意力机制模块用于通过自注意力机制对各个接收到的数据进行处理;

4.根据权利要求3所述的一种目标识别方法,其特征在于,所述解码器包括依次设置的第一膨胀卷积层、第一分块反向注意力机制模块、第二膨胀卷积层、第二分块反向注意力机制模块、第二卷积层、第三分块反向注意力机制模块、第三卷积层、第四分块反向注意力机制模块、紧凑度度量模块和特征...

【专利技术属性】
技术研发人员:郑明夏震宇林跃进吕家辉叶海娟陈滢徐欢赵舒雷李彬旗
申请(专利权)人:温州电力设计有限公司普华招标咨询分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1