一种基于空间引导自注意力的食品识别方法及系统技术方案

技术编号：40430500 阅读：4 留言：0更新日期：2024-02-20 22:52

本发明专利技术提出了一种基于空间引导自注意力的食品识别方法及系统，涉及计算机视觉领域。本发明专利技术根据图像特征图获取目标位置编码，并根据编码引导自注意力机制只计算存在目标的位置，同时将图像特征图进行拆分处理，并以级联方式处理拆分的图像特征图，从而达到节约计算量的目的，另外根据目标位置编码的计算方式，也可以达到节约大量计算量，并为自注意力计算提供先验知识。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于计算机视觉领域，特别涉及一种基于空间引导自注意力的食品识别方法及系统。

技术介绍

1、自注意力机制是深度学习领域中备受瞩目的特征处理技术。自注意力机制通过学习特征之间的相互依赖关系，使得模型能够准确地捕捉上下文信息，无论是在自然语言处理还是计算机视觉任务中都展现了出色的性能。然而，尽管自注意力机制取得了显著的成就，但目前这种机制仍然存在问题，例如运算量大，模型复杂度高等。如果能够在一个模型中用更少的计算量，仍充分利用自注意力机制的优势，就能够在特征的表达和信息的处理速度上取得双赢的效果。

技术实现思路

1、本专利技术提供一种基于空间引导自注意力的食品识别方法及系统，旨在减少传统自注意力的计算量，并通过空间注意力关注目标存在位置，从而提高食品的识别效果。

2、本专利技术对于传统自注意力机制作出了改进，提供一种基于空间引导自注意力的食品识别方法，包括以下步骤：

3、s1、获取食品摄像头视频，每秒对摄像头进行抽帧，获得食品待检测图像；

4、s2、构建空间引导自注意力模块，输入图像特征到该模块，将图像特征进行空间注意力操作，得到图像每个像素的空间位置得分，将得分进行阈值筛选，将得分高的像素位置视为存在目标位置，并将这些位置形成图像特征对应的目标位置编码，然后根据目标位置编码，将图像特征中非目标位置重置为0，然后将图像特征拆分为多个特征块，依次计算每个特征块，单个特征块生成对应q、k、v，并进行自注意力计算，输出该特征块对应的优化特征，除第一

5、s3、构建食品检测模型，模型由骨干网络、空间引导自注意力模块、检测头组成；

6、s4、将食品待检测图像输入进食品检测模型，获得食品检测结果。

7、优选地，s2中的空间引导自注意力模块，如果输入图像特征为位置编码 s 的计算为，sattn 为空间注意力操作，max 为阈值筛选，将图像特征中非目标位置重置为0后的特征图计算为,⊙表示逐位置相乘，mask(s)是一个与 s 具有相同形状的矩阵，其中 s 所指定的位置的元素为1，其他位置为0，对 x应用这样的掩码操作，就可以得到经过 s 筛选后的特征图，然后每个拆分特征图的优化特征的计算为其中代表特征图的第j个拆分特征图，分别代表生成q、k、v的权重矩阵，attn代表自注意力计算，然后将所有的优化特征进行连接，得到和图像特征维度相同的优化图像特征的计算为，其中h为拆分的特征图数量，为线性层，目的是将输出的优化图像特征投影回与输入图像特征一致的维度。

8、本专利技术还提供一种基于空间引导自注意力的食品识别系统，其特征在于，包括食品图像数据采集模块、食品检测模块，通过食品图像数据采集模块采集所要检测的食品目标图像，食品检测模块内置食品检测模型，模型由骨干网络、空间引导自注意力模块、检测头组成，对于空间引导自注意力模块，输入图像特征到该模块，将图像特征进行空间注意力操作，得到图像每个像素的空间位置得分，将得分进行阈值筛选，将得分高的像素位置视为存在目标位置，并将这些位置形成图像特征对应的目标位置编码，然后根据目标位置编码，将图像特征中非目标位置重置为0，然后将图像特征拆分为多个特征块，依次计算每个特征块，单个特征块生成对应q、k、v，并进行自注意力计算，输出该特征块对应的优化特征，除第一个计算的特征块，每一个特征块和上一特征块对应的优化特征进行相加运算，然后再进行自注意力计算，所有特征块计算完毕，将所有的优化特征进行连接，得到和图像特征维度相同的优化图像特征，并进行输出。

9、与现有技术相比，本专利技术具有以下技术效果：

10、本专利技术提供的技术方案首先根据图像特征图获取目标位置编码，并根据编码引导自注意力机制只计算存在目标的位置，同时将图像特征图进行拆分处理，并以级联方式处理拆分的图像特征图，从而达到节约计算量的目的，另外根据目标位置编码的计算方式，也可以达到节约大量计算量，并为自注意力计算提供先验知识。

本文档来自技高网...

【技术保护点】

1.一种基于空间引导自注意力的食品识别方法，其特征在于，包括以下步骤：

2.据权利要求1所述的一种基于空间引导自注意力的食品识别方法，其特征在于，S2中的空间引导自注意力模块，如果输入图像特征为位置编码s的计算为，SAttn为空间注意力操作，MAX 为阈值筛选，将图像特征中非目标位置重置为0后的特征图计算为,⊙表示逐位置相乘，Mask(s) 是一个与 s 具有相同形状的矩阵，其中 s 所指定的位置的元素为1，其他位置为0，对 x 应用这样的掩码操作，就可以得到经过 s 筛选后的特征图，然后每个拆分特征图的优化特征的计算为其中代表特征图的第j个拆分特征图，分别代表生成Q、K、V的权重矩阵，Attn代表自注意力计算，然后将所有的优化特征进行连接，得到和图像特征维度相同的优化图像特征的计算为，其中h为拆分的特征图数量，为线性层，目的是将输出的优化图像特征投影回与输入图像特征一致的维度。

3.一种基于空间引导自注意力的食品识别系统，其特征在于，包括食品图像数据采集模块、食品检测模块，通过食品图像数据采集模块采集所要检测的食品目标图像，食品检测模块内置食品检测模型，

...

【技术特征摘要】

1.一种基于空间引导自注意力的食品识别方法，其特征在于，包括以下步骤：

2.据权利要求1所述的一种基于空间引导自注意力的食品识别方法，其特征在于，s2中的空间引导自注意力模块，如果输入图像特征为位置编码s的计算为，sattn为空间注意力操作，max 为阈值筛选，将图像特征中非目标位置重置为0后的特征图计算为,⊙表示逐位置相乘，mask(s) 是一个与 s 具有相同形状的矩阵，其中 s 所指定的位置的元素为1，其他位置为0，对 x 应用这样的掩码操作，就可以得到经过 s 筛选后的特征图，然后每个拆分特征图的优化特征的计算为其中代表特征图的第j个拆分特征图，分别代表生成q、k、v的权重矩阵，attn代表自注意力计算，然后将所有的优化特征进行连接，得到和图像特征维度相同的优化图像特征的计算为，其中h为拆分的特征图数量，为线性层，目的是将输出的优化图像特征投影回与输入图像特征一致的维度。

...

【专利技术属性】
技术研发人员：李忠涛，程文轩，张波，王凯，张玉璘，
申请(专利权)人：济南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人