当前位置: 首页 > 专利查询>济南大学专利>正文

一种基于集中注意力的商品识别方法及系统技术方案

技术编号:41706374 阅读:17 留言:0更新日期:2024-06-19 12:37
本发明专利技术提供一种基于集中注意力的商品识别方法及系统,涉及计算机视觉领域。本发明专利技术根据图像多尺度特征图,通过前景目标token选择器来预测每个特征图的前景评分,再通过多类别分数预测器把得分较高的token确定为用于增强计算的token,将这些高分token分散回原始特征序列中,得到优化后的图像特征序列,提升了计算效率、节约了计算量,并为在高分辨率图片目标检测中权衡计算效率和模型精度提供先验知识。

【技术实现步骤摘要】

本专利技术属于计算机视觉领域,特别涉及一种基于集中注意力的商品识别方法及系统


技术介绍

1、detr模型显著提高了检测器的性能,甚至优于经典卷积模型。然而,在传统的编码器结构中,所有的信息token都被一视同仁的对待,这带来了冗余的计算负担。如果能够将集中注意力在携带更多信息的token上,就能够在提升计算效率和提升模型精度之间达到更好的平衡。


技术实现思路

1、本专利技术提供一种基于集中注意力的商品识别方法及系统,旨在减少传统detr模型的计算量,通过集中注意力在携带更多信息的token,从而提升商品的识别效率和识别精度。

2、本专利技术对传统detr模型作出了改进,提供一种基于集中注意力的商品识别方法,包括以下步骤:

3、s1、获取摄像头视频流,每秒对其抽帧获取待检测图片;

4、s2、构建集中注意力模块,将来自骨干网络的多尺度特征图输入到该模块;首先,把多尺度特征图输入到前景目标选择器中,利用ground truth框和标签来监督前景选择,用一个基于多层感知器的评分模本文档来自技高网...

【技术保护点】

1.一种基于集中注意力的商品识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于注意力集中的商品识别方法,S2中的自上而下分数调制,其特征在于,形式上,获取来自主干的多尺度特征,其中,我们获得三种不同尺度的特征映射,并下采样以获得即;考虑到高阶特征图比低阶特征图包含更丰富的语义和更高的分辨率,通过上采样的方式逐层传输前景分数;对于给定特征映射,其中,,其中,表示第个特征映射的前景分数,是使用双线性插值的上采样函数,是所有特征映射中token的全局分数预测器,是一组可学习的调制系数,表示多尺度特征映射的层数,通过这种方式,不同特征图的定位信息相互关联。

...

【技术特征摘要】

1.一种基于集中注意力的商品识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于注意力集中的商品识别方法,s2中的自上而下分数调制,其特征在于,形式上,获取来自主干的多尺度特征,其中,我们获得三种不同尺度的特征映射,并下采样以获得即;考虑到高阶特征图比低阶特征图包含更丰富的语义和更高的分辨率,通过上采样的方式逐层传输前景分数;对于给定特征映射,其中,,其中,表示第个特征映射的前景分数,是使用双线性插值的上采样函数,是所有特征映射中token的全局分数预测器,是一组可学习的调制系数,表示多尺度特征映射的层数,通过这种方式,不同特征图的定位信息相互关联。

3.根据权利要求1所述的一种基于集中注意力的商品识别方法,s2中的多类别分数预测器,其特征在于,为避免对背景token进行无意义的计算,采用前景信息和类别语义信息叠加策略,由预测器计算得到前景类别得分,获得类别分数最大值,前景得分和类别得分的乘积作为确定注意力计算中涉及的细粒度to...

【专利技术属性】
技术研发人员:李忠涛谷亚奇孔祥玉王凯张波郭庆北张玉璘陈图川
申请(专利权)人:济南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1