【技术实现步骤摘要】
本专利技术属于计算机视觉领域,特别涉及一种基于集中注意力的商品识别方法及系统。
技术介绍
1、detr模型显著提高了检测器的性能,甚至优于经典卷积模型。然而,在传统的编码器结构中,所有的信息token都被一视同仁的对待,这带来了冗余的计算负担。如果能够将集中注意力在携带更多信息的token上,就能够在提升计算效率和提升模型精度之间达到更好的平衡。
技术实现思路
1、本专利技术提供一种基于集中注意力的商品识别方法及系统,旨在减少传统detr模型的计算量,通过集中注意力在携带更多信息的token,从而提升商品的识别效率和识别精度。
2、本专利技术对传统detr模型作出了改进,提供一种基于集中注意力的商品识别方法,包括以下步骤:
3、s1、获取摄像头视频流,每秒对其抽帧获取待检测图片;
4、s2、构建集中注意力模块,将来自骨干网络的多尺度特征图输入到该模块;首先,把多尺度特征图输入到前景目标选择器中,利用ground truth框和标签来监督前景选择,用一个基
...【技术保护点】
1.一种基于集中注意力的商品识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于注意力集中的商品识别方法,S2中的自上而下分数调制,其特征在于,形式上,获取来自主干的多尺度特征,其中,我们获得三种不同尺度的特征映射,并下采样以获得即;考虑到高阶特征图比低阶特征图包含更丰富的语义和更高的分辨率,通过上采样的方式逐层传输前景分数;对于给定特征映射,其中,,其中,表示第个特征映射的前景分数,是使用双线性插值的上采样函数,是所有特征映射中token的全局分数预测器,是一组可学习的调制系数,表示多尺度特征映射的层数,通过这种方式,不同特征图的定位信
...【技术特征摘要】
1.一种基于集中注意力的商品识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于注意力集中的商品识别方法,s2中的自上而下分数调制,其特征在于,形式上,获取来自主干的多尺度特征,其中,我们获得三种不同尺度的特征映射,并下采样以获得即;考虑到高阶特征图比低阶特征图包含更丰富的语义和更高的分辨率,通过上采样的方式逐层传输前景分数;对于给定特征映射,其中,,其中,表示第个特征映射的前景分数,是使用双线性插值的上采样函数,是所有特征映射中token的全局分数预测器,是一组可学习的调制系数,表示多尺度特征映射的层数,通过这种方式,不同特征图的定位信息相互关联。
3.根据权利要求1所述的一种基于集中注意力的商品识别方法,s2中的多类别分数预测器,其特征在于,为避免对背景token进行无意义的计算,采用前景信息和类别语义信息叠加策略,由预测器计算得到前景类别得分,获得类别分数最大值,前景得分和类别得分的乘积作为确定注意力计算中涉及的细粒度to...
【专利技术属性】
技术研发人员:李忠涛,谷亚奇,孔祥玉,王凯,张波,郭庆北,张玉璘,陈图川,
申请(专利权)人:济南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。