一种基于自适应对比学习的菜品识别方法技术

技术编号：34171289 阅读：10 留言：0更新日期：2022-07-17 10:50

本发明专利技术涉及一种基于自适应对比学习的菜品识别方法，与传统的菜品识别方法不同，基于自适应对比学习的神经网络，无需在线训练，对推理环境要求较低，本发明专利技术提出多尺度三元组损失函数，使得神经网络自适应的学习不同尺度差异的损失，从而更好的区分菜品间的细微差异；所述的多尺度三元组损失函数由包括三种边界的三元组损失函数以及一个最大值选择函数组成，可自适应选择三元组损失的边界值；本发明专利技术通过自适应对比学习的方式来实现菜品识别的离线推理，不仅不受菜品种类的约束，能够应对类别的实时变化，离线推理还大大降低了菜品识别应用环境的算力要求；本发明专利技术通过在反馈过程中引入低相似度样本自动删除，使得菜品识别方法可以长时间稳定运行。法可以长时间稳定运行。法可以长时间稳定运行。

A dish recognition method based on adaptive contrast learning

全部详细技术资料下载

【技术实现步骤摘要】
一种基于自适应对比学习的菜品识别方法

[0001]本专利技术涉及一种用基于自适应对比学习的菜品识别方法。

技术介绍

[0002]现有的经典菜品识别方法，往往基于神经网络对不同菜品进行分类的方式来实现，这种方式往往需要对神经网络的参数进行重新训练来实现，需要依赖云端或边端有较大的算力以及较长的训练时间。由于需要较长的时间对网络参数进行训练，传统的菜品无法实时新增。传统的基于对比学习的方案往往无视菜品之间的相似程度，使用同一个距离的边界值来计算损失函数，导致特征提取网络预测的特征的可区分性不强。此外，基于对比学习的菜品识别方案在识别的过程中往往会累积错误，导致菜品识别的精度会随着使用时间而变差。

技术实现思路

[0003]本专利技术的一个目的，就是是解决至少上述问题和/或缺陷中的一种，并提供至少后面讲说明的优点。
[0004]本专利技术还有一个目的，是提供一种基于自适应对比学习的菜品识别方法，其能够通过使用自适应边界的三元组损失函数，来优化特征提取网络预测特征的可区分性，保障菜品识别的高精度。通过引入低相似度样本自动删除的策略，有效缓解了菜品识别推理中错误累计的问题。
[0005]为了实现根据本专利技术的这些目的和其他优点，提供了一种基于自适应对比学习的菜品识别方法，包括：在训练过程中，提出了一种基于自适应对比学习损失函数的特征提取模型的训练方法，对每一个三元组同时计算基于三种不同边界的三元组损失，然后对每一个三元组选择三个损失值中较大的损失值用于反向传播；神经网络参数固定，仅做推理，无需...

【技术保护点】

【技术特征摘要】
1.一种基于自适应对比学习的菜品识别方法，其特征在于包括：A)训练步骤，包括从训练集中随机选择32个不同的菜品类别，然后从每个菜品类别中随机取8张图片，共256张图片进行数据增强，包括：A1)对所选的256张图片以Q1的概率做水平翻转得到随机水平翻转后的256张图片；A2)对步骤A1)中得到的256张图片以Q2的概率做竖直翻转得到随机竖直翻转后的256张图片；A3)对步骤A2)中得到的256张图片按顺序以Q3的概率增加随机的对比度噪声、饱和度噪声和亮度噪声，得到随机增加随机噪声的256张图片；A4)图像重采样和像素值归一化，包括将步骤A3)中得到的256张图片均重采样，得到宽高均为224个像素的256张图片，将每张图片的像素值归一化处理为0和1之间；A5)将上述重采样和像素值归一化处理后的256张图片输入到特征提取网络中，该特征提取网络可以是任意的可用于图像分类的神经网络，本发明以ResNet18、ResNet50为例，得到尺寸为(256,V)的特征向量,V可以是任意长度，本发明以常见的1000为例；A6)根据256张图片的菜品ID找出这256张图片中存在的所有的三元组(a,p,n)，其中a为基于模版图片提取的特征，p为基于任意一张与a同菜品类别的输入图片提取的特征，n为基于任意一张与a不同菜品类别的输入图片提取的特征，计算每个三元组的多尺度三元组损失L
B
＝max{d(a,p)
‑
d(a,n)+M
B
,0}、中等边界三元组损失L
I
＝g*max{d(a,...

【专利技术属性】
技术研发人员：胡海苗，徐振博，黄龚，姜宏旭，李明竹，
申请(专利权)人：杭州食方科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人