【技术实现步骤摘要】
所属的技术人员知道,本专利技术可以实现为系统、方法或计算机程序产品,因此,本专利技术可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的软件(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“电路”、“模块”或“系统”。此外,在一些实施例中,本专利技术还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。尽管上面已经示出和描述了本专利技术的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本专利技术的限制,本领域的普通技术人员在本专利技术的范围内可以对上述实施例进行变化、修改、替换和变型。
技术介绍
1、在现实世界中,几乎所有领域都广泛应用着图像数据,在这些应用中,通常需要一定技术检测及确定最具视觉意义的目标数据。多模态文档图片中包含着大量非结构化信息,例如文本、表格和图像,这些信息常用于存储关键业务数据。多模态文档图片中通常包含多个小目标,这些小目标通常代表设备名称、技术参数、价格等关键信息,虽然体积较小,但其信息价值极高。通过提取这些目标,
...【技术保护点】
1.一种目标识别方法,其特征在于,包括:
2.根据权利要求1所述的一种目标识别方法,其特征在于,所述解码器具体用于:利用膨胀卷积层、分块反向注意力机制模块和卷积层,对所述样本图像在不同阶段的图像特征进行渐进融合,对最终融合图像特征赋予不同权重,再进行特征增强操作,得到增强后的最终融合图像特征。
3.根据权利要求2所述的一种目标识别方法,其特征在于,所述编码器包括依次设置的第一卷积层、第一自注意力机制模块、第二自注意力机制模块和第三自注意力机制模块;第一自注意力机制模块、第二自注意力机制模块和第三自注意力机制模块用于通过自注意力机制对各个接收到的
...【技术特征摘要】
1.一种目标识别方法,其特征在于,包括:
2.根据权利要求1所述的一种目标识别方法,其特征在于,所述解码器具体用于:利用膨胀卷积层、分块反向注意力机制模块和卷积层,对所述样本图像在不同阶段的图像特征进行渐进融合,对最终融合图像特征赋予不同权重,再进行特征增强操作,得到增强后的最终融合图像特征。
3.根据权利要求2所述的一种目标识别方法,其特征在于,所述编码器包括依次设置的第一卷积层、第一自注意力机制模块、第二自注意力机制模块和第三自注意力机制模块;第一自注意力机制模块、第二自注意力机制模块和第三自注意力机制模块用于通过自注意力机制对各个接收到的数据进行处理;
4.根据权利要求3所述的一种目标识别方法,其特征在于,所述解码器包括依次设置的第一膨胀卷积层、第一分块反向注意力机制模块、第二膨胀卷积层、第二分块反向注意力机制模块、第二卷积层、第三分块反向注意力机制模块、第三卷积层、第四分块反向注意力机制模块、紧凑度度量模块和特征...
【专利技术属性】
技术研发人员:郑明,夏震宇,林跃进,吕家辉,叶海娟,陈滢,徐欢,赵舒雷,李彬旗,
申请(专利权)人:温州电力设计有限公司普华招标咨询分公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。