基于特征提取和向量检索的烟包识别方法及系统技术方案

技术编号：42662115 阅读：26 留言：0更新日期：2024-09-10 12:19

本发明专利技术涉及基于特征提取和向量检索的烟包识别方法及系统，获取烟包图像，经预处理得到查询图像；查询图像利用训练完毕的特征提取网络，得到查询向量；查询向量利用索引库进行特征向量的相似度计算和搜索，返回候选向量的相似度排序结果，将相似度最高的候选向量的分类标签作为查询图像的分类结果，即为相对应的烟包识别结果。只需要训练一次特征提取网络，后续烟包品类的更新仅需对图像库进行相应更新，无需重新训练模型，降低了实际应用的成本，满足频繁更新的识别需求。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像识别，具体为基于特征提取和向量检索的烟包识别方法及系统。

技术介绍

1、本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息，不必然构成在先技术。

2、商品识别系统是搭载在自动售货设备或售货机器人中的软件，以销售烟草的机器人为例，这类机器人会利用商品识别系统实现烟包图像的自动识别和分类，从而完成商品烟包的入库和销售结算等功能。商品识别系统中内置的算法，通过预先收集大量带有标签的商品图像作为训练数据集，这些图像涵盖不同的商品类别，并具有各种不同的角度、光照和背景条件。通过对图像进行预处理，如调整大小、裁剪和归一化，以确保输入图像具有一致的尺寸和颜色。将训练数据集输入到分类识别模型中，对模型进行训练。训练过程中，模型会根据真实标签与预测结果之间的差异进行反向传播优化，逐渐调整模型的参数和权重，使其更好地适应商品分类任务。

3、这类算法的缺陷主要表现在对于不断更新的商品类别需求的适应性不足。当自动售货设备或售货机器人更新可销售的商品类别时，会带来图像的大幅变化，例如烟包的类别或包装变化，或是将烟草销售机器人改变为销售其他商品的机器人等，会需要商品识别系统具有快速适应新需求的能力。而传统的图像分类识别算法使用固定的模型进行商品分类，一旦新的商品类别出现，就需要重新收集、标记大量新数据，并对整个模型进行重新训练，导致识别新商品类别的过程变得繁琐和耗时，并且训练成本昂贵，进而增加系统的维护成本和运营成本。

技术实现思路

1、为了解决上述
技术介绍
中存在

2、为了实现上述目的，本专利技术采用如下技术方案：

3、本专利技术的第一个方面提供基于特征提取和向量检索的烟包识别方法，包括以下步骤：

4、获取烟包图像，经预处理得到查询图像；

5、查询图像利用训练完毕的特征提取网络，得到查询向量；

6、查询向量利用索引库进行特征向量的相似度计算和搜索，返回候选向量的相似度排序结果，将相似度最高的候选向量的分类标签作为查询图像的分类结果，即为相对应的烟包识别结果。

7、进一步的，特征提取网络通过图像库及训练数据集实现训练，包括：

8、获取不同品类的烟包图像，建立图像库；

9、将输入图像分割成多个尺寸的图像块；

10、经展平、线性转换和向量嵌入，得到含有空间信息的图像块线性嵌入序列，利用主干网络得到特征向量。

11、进一步的，特征提取网络通过图像库及训练数据集实现训练，还包括：

12、主干网络得到特征向量通过颈部结构进行维度变换和激活，并通过全连接层转化为向量，通过计算损失函数更新特征提取网络的参数，直至损失收敛到最小值并且不再下降时，完成训练。

13、进一步的，将输入图像分割成多个尺寸的图像块，包括：若图片尺寸和分块大小的参数组合满足整除要求时，则沿宽度和高度维度上，分块数量为：

14、；

15、；

16、其中，,分别代表图像的宽和高，和分别代表分块的宽、高和对应的滑动步长。

17、进一步的，将输入图像分割成多个尺寸的图像块，还包括：若图片尺寸和分块大小的参数组合不满足整除要求时，对输入图像的尺寸进行动态调整，如下式所示：

18、；

19、；

20、其中，,分别代表图像的宽和高，和分别代表分块的宽、高和对应的滑动步长。

21、进一步的，建立图像库，具体为：通过获取不同品类烟包的多角度图像，通过旋转、裁剪、添加噪声和仿射变换中的至少一种扩充图像数据。

22、进一步的，查询向量利用索引库进行特征向量的相似度计算和搜索，返回候选向量的相似度排序结果，包括：

23、构建索引库，索引库为多层次图结构；

24、获取查询向量，即输入查询图像的特征向量，从层次结构的顶层开始，逐层向下搜索与查询向量相似度最高的候选向量；

25、在每一层中，根据相似度评估进行剪枝操作，只保留与查询向量相似度满足设定值的候选向量；

26、根据剪枝后得到的候选向量，逐层向上回溯来重定位；

27、在所有层次的搜索过程结束后，根据余弦相似度的排序结果，返回相似度最高的候选向量的分类标签作为查询图像的分类结果。

28、进一步的，构建索引库，具体为：随机选择一个样本作为初始节点，并为其分配层级为0，依次将其余的样本向量添加到索引库中，并根据相似度将它们连接到相对应的层级节点上，根据相似度进行向上和向下的链接操作，形成多层次的图结构。

29、本专利技术的第二个方面提供实现上述方法所需的系统，包括：

30、特征提取模块，被配置为：获取烟包图像，经预处理得到查询图像；

31、特征提取模块，还被配置为：查询图像利用训练完毕的特征提取网络，得到查询向量；

32、向量检索模块，被配置为：查询向量利用索引库进行特征向量的相似度计算和搜索，返回候选向量的相似度排序结果，将相似度最高的候选向量的分类标签作为查询图像的分类结果，即为相对应的烟包识别结果。

33、本专利技术的第三个方面提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述基于特征提取和向量检索的烟包识别方法中的步骤。

34、本专利技术的第四个方面提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行程序时实现上述基于特征提取和向量检索的烟包识别方法中的步骤。

35、与现有技术相比，以上一个或多个技术方案存在以下有益效果：

36、1、不同于传统的图像分类算法，采用特征提取结合向量检索的方式来进行烟包识别，通过在已经建立好的索引库中搜索与查询向量最相似的结果，并将其作为烟包的分类标签。只需要训练一次特征提取网络，后续烟包品类的更新仅需对图像库进行相应更新即可，无需重新训练模型，降低了实际应用的成本，满足频繁更新的识别需求。

37、2、此外，传统的图像识别方法中，一般会将图像平均分成几种固定的图像块进行识别（常见的为3×3或5×5），而针对烟包检测的场景特点，所使用的图像分块方式使得块与块之间保持了一定程度的重叠，由于识别到的烟包图像的尺寸相较于整体图像而言较小，并且在图像上的排布较为密集，因此，如果按照传统方法进行划分，会造成大量处在分块边缘的待测目标横跨多个子块的情况，难以被其中任一子块完整识别，从而增加了漏检率，因此通过部分重叠的方式能够解决该问题。

本文档来自技高网...

【技术保护点】

1.基于特征提取和向量检索的烟包识别方法，其特征在于，包括以下步骤：

2.如权利要求1所述的基于特征提取和向量检索的烟包识别方法，其特征在于，特征提取网络通过图像库及训练数据集实现训练，包括：

3.如权利要求2所述的基于特征提取和向量检索的烟包识别方法，其特征在于，建立图像库，具体为：通过获取不同品类烟包的多角度图像，通过旋转、裁剪、添加噪声和仿射变换中的至少一种扩充图像数据。

4.如权利要求3所述的基于特征提取和向量检索的烟包识别方法，其特征在于，将输入图像分割成多个尺寸的图像块，包括：若图片尺寸和分块大小的参数组合满足整除要求时，则沿宽度和高度维度上，分块数量为：

5.如权利要求3所述的基于特征提取和向量检索的烟包识别方法，其特征在于，将输入图像分割成多个尺寸的图像块，还包括：若图片尺寸和分块大小的参数组合不满足整除要求时，对输入图像的尺寸进行动态调整，如下式所示：

6.如权利要求1所述的基于特征提取和向量检索的烟包识别方法，其特征在于，查询向量利用索引库进行特征向量的相似度计算和搜索，返回候选向量的相似度排序结果，包括：

7.如权利要求6所述的基于特征提取和向量检索的烟包识别方法，其特征在于，构建索引库，具体为：随机选择一个样本作为初始节点，并为其分配层级为0，依次将其余的样本向量添加到索引库中，并根据相似度将它们连接到相对应的层级节点上，根据相似度进行向上和向下的链接操作，形成多层次的图结构。

8.基于特征提取和向量检索的烟包识别系统，其特征在于，包括：

9.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，该程序被处理器执行时实现如权利要求1-7任一项所述的基于特征提取和向量检索的烟包识别方法中的步骤。

10.一种计算机设备，其特征在于，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行程序时实现如权利要求1-7任一项所述基于特征提取和向量检索的烟包识别方法中的步骤。

...

【技术特征摘要】

1.基于特征提取和向量检索的烟包识别方法，其特征在于，包括以下步骤：

2.如权利要求1所述的基于特征提取和向量检索的烟包识别方法，其特征在于，特征提取网络通过图像库及训练数据集实现训练，包括：

6.如权利要求1所述的基于特征提...

【专利技术属性】
技术研发人员：刘巍，王丽，王明霞，宋时浩，宫玮，郑宏伟，刘宝平，张莎莎，张子墨，
申请(专利权)人：山东中烟工业有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人