一种基于多模态的AI菜品识别方法、系统、设备及介质技术方案

技术编号:38863823 阅读:20 留言:0更新日期:2023-09-17 10:04
本发明专利技术公开了一种基于多模态的AI菜品识别方法、系统、设备及介质,涉及菜品识别技术领域,所述方法通过采集菜品的RGB图像和热图像,通过角点校正将其校正、匹配叠加得到融合图像,然后利用聚类算法对融合图像进行分割,选择识别区域并识别菜品类别。本发明专利技术能够结合多模态图像信息进行菜品类别识别,提高了识别准确性,通过图像校正和融合,能够消除图像畸变和配准问题,得到更清晰、准确的图像,聚类算法的应用使得图像分割更加精确,能够选择感兴趣的菜品区域进行后续处理。的菜品区域进行后续处理。的菜品区域进行后续处理。

【技术实现步骤摘要】
一种基于多模态的AI菜品识别方法、系统、设备及介质


[0001]本专利技术涉及菜品识别
,具体涉及一种基于多模态的AI菜品识别方法、系统、设备及介质。

技术介绍

[0002]近年来,随着深度学习的兴起,基于卷积神经网络(CNN)的菜品分类方法取得了显著的进展。CNN能够自动学习图像的特征表示,避免了手工设计特征的繁琐过程。
[0003]然而,现有的菜品分类方法仍然存在一些限制。首先,它们主要依赖于单一模态的图像数据,无法充分利用多模态信息来提高分类准确性。其次,现有方法在菜品图像的获取、处理和分类过程中需要大量的时间和人力参与,增加了成本和门槛。

技术实现思路

[0004]针对现有技术中的缺陷,本专利技术提供一种基于多模态的AI菜品识别方法、系统、设备及介质。
[0005]第一方面,一种基于多模态的AI菜品识别方法,包括
[0006]S1.获取菜品的RGB图像和热图像;
[0007]S2.校正所述RGB图像和所述热图像,将两幅图像进行匹配叠加得到融合图像;
[0008]S3.通过聚类算法对三幅图像进行分割得到不同分割区域;
[0009]S4.在不同的分割区域中选择识别区域并识别菜品类别。
[0010]优选地,S1中,获取菜品的RGB图像和热图像设备包括电脑、摄像机、手机。
[0011]优选地,S2中,校正所述RGB图像和所述热图像;
[0012]S201,使用Shi

Tomasi角点检测来检测所述RGB图像中的四个角点,通过角点响应函数计算选择响应值最高的四个角点作为RGB图像中矩形区域的第一角点;
[0013]S202,基于所述第一角点,通过角点与RGB图像中对应角点之间的对应关系计算透视变换矩阵,根据得到的透视变化矩阵校正RGB图像,
[0014]S203,校正所述RGB图像中的任意四个点映射到热图像上,得到热图像的第二角点,基于第二角点和S202中透视变换矩阵的到校正的热图像。
[0015]S301.根据S201中获取RGB图像的四个第一角点使用K最近邻算法找到每个角点在热图像中的匹配点;
[0016]S302.根据热图像中的匹配点,使用RANSAC算法来迭代RGB图像和热图像中匹配点对,并筛选出较好的匹配点对,得到两幅图像之间的最佳拟合关系;
[0017]S303.将RGB图像和热图像根据最佳拟合关系进行配准,使得两幅图像在几何上对齐,根据所估计的变换模型,利用加权融合方法将RGB图像上的像素映射到热图像上的对应位置;
[0018]S304.将映射对应的RGB图像和热图像进行融合,得到融合图像。
[0019]优选的,S3中,通过聚类算法对三幅图像进行分割得到不同分割区域;
[0020]S401.每幅图像随机选择K个初始聚类中心,对每个像素,计算其与各个聚类中心的距离,并将其分配到距离最近的聚类中心所属的簇,对每个聚类簇,计算该簇内所有像素的平均值,并更新聚类中心的位置,重复分配和更新,直到聚类中心的变化小于设定阈值;
[0021]S402.根据最终的聚类中心,将图像中的像素分配到对应的聚类簇,形成不同的分割区域。
[0022]优选的,S4中,在不同的分割区域中选择识别区域并识别菜品类别;
[0023]S501.基于不同的分割区域选择菜品区域,在所述菜品区域内提取RGB图像的第一特征、热成像图像的第二特征以及融合图像的第三特征,其中,第一特征包括颜色直方图,第二特征包括温度分布特征,第三特征包括菜品纹理特征;
[0024]S502.将提取的特征输入到已经训练好的菜品识别模型中进行分类,得到菜品类别。
[0025]优选的,在S502中已经训练好的菜品识别模型;
[0026]卷积层,用于提取ChineseFoodNet数据集中的局部第三特征图;
[0027]池化层,用于降低局部特征图的维度;
[0028]全连接层,用于将提取的第三局部特征图映射到不同的菜品类别,通过多次迭代ChineseFoodNet数据集,不断调整模型参数以得到满足最小化损失函数的菜品识别模型。
[0029]优选的,S5之后还包括以下步骤:
[0030]对识别到的菜品类别进行类别编码处理,生成类别识别编码;
[0031]将所述类别识别编码存入存储装置,方便下次菜品识别时使用。
[0032]第二方面,一种基于基于多模态的AI菜品识别系统,包括:
[0033]获取模块,用于获取菜品的RGB图像和热图像;
[0034]图像校正模块,用于对所述RGB图像和所述热图像进行校正,将两幅图像匹配叠加得到融合图像;
[0035]分割处理模块,用于通过聚类算法对三幅图像进行分割处理得到不同分割区域;
[0036]分类处理模块,用于在不同的分割区域中选择识别区域并识别菜品类别。
[0037]第三方面,一种电子设备,包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行上述的任一项所述方法的指令。
[0038]第四方面,一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,所述计算机程序被计算机执行时,实现上述的任一项所述的方法。
[0039]本专利技术的有益效果体现在:本专利技术公开了一种基于多模态的AI菜品识别方法、系统、设备及介质。该方法通过采集菜品的RGB图像和热图像,通过角点校正将其校正、匹配叠加得到融合图像。然后利用聚类算法对融合图像进行分割,选择识别区域并识别菜品类别。该系统的优点在于能够结合多模态图像信息进行菜品类别识别,提高了识别准确性。通过图像校正和融合,能够消除图像畸变和配准问题,得到更清晰、准确的图像。
附图说明
[0040]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件
或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
[0041]图1为本专利技术实施例一所提供的一种基于多模态的AI菜品识别方法的流程图;
[0042]图2为本专利技术实施例一所提供的一种基于多模态的AI菜品识别方法中S2的流程图;
[0043]图3为本专利技术实施例一所提供的一种基于多模态的AI菜品识别方法中S2的一子流程图;
[0044]图4为本专利技术实施例一所提供的一种基于多模态的AI菜品识别方法中S3的流程图;
[0045]图5为本专利技术实施例一所提供的一种基于多模态的AI菜品识别方法中S4的流程图;
[0046]图6为本专利技术实施例二所提供的一种基于多模态的AI菜品识别系统的结构示意图;
[0047]图7为本专利技术实施例三所提供的一种计算机设备的结构示意图。
具体实施方式
[0048]下面将结合附图对本专利技术技术方案的实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多模态的AI菜品识别方法,其特征在于,包括以下步骤:S1.获取菜品的RGB图像和热图像;S2.校正所述RGB图像和所述热图像,将两幅图像进行匹配叠加得到融合图像;S3.通过聚类算法对三幅图像进行分割得到不同分割区域;S4.在不同的分割区域中选择识别区域并识别菜品类别。2.根据权利要求1所述的一种基于多模态的AI菜品识别方法,其特征在于,S2中,校正所述RGB图像和所述热图像的方法包括:S201,使用Shi

Tomasi角点检测来检测所述RGB图像中的四个角点,通过角点响应函数计算选择响应值最高的四个角点作为RGB图像中矩形区域的第一角点;S202,基于所述第一角点,通过角点与RGB图像中对应角点之间的对应关系计算透视变换矩阵,根据得到的透视变化矩阵校正RGB图像,S203,校正所述RGB图像中的任意四个点映射到热图像上,得到热图像的第二角点,基于第二角点和S202中透视变换矩阵的到校正的热图像。3.根据权利要求1所述的一种基于多模态的AI菜品识别方法,其特征在于,S2中,将两幅图像进行匹配叠加得到融合图像的方法包括以下步骤:S301.根据S201中获取RGB图像的四个第一角点使用K最近邻算法找到每个角点在热图像中的匹配点;S302.根据热图像中的匹配点,使用RANSAC算法来迭代RGB图像和热图像中匹配点对,并筛选出较好的匹配点对,得到两幅图像之间的最佳拟合关系;S303.将RGB图像和热图像根据最佳拟合关系进行配准,使得两幅图像在几何上对齐,根据所估计的变换模型,利用加权融合方法将RGB图像上的像素映射到热图像上的对应位置;S304.将映射对应的RGB图像和热图像进行融合,得到融合图像。4.根据权利要求1所述的一种基于多模态的AI菜品识别方法,其特征在于,S3中,通过聚类算法对三幅图像进行分割得到不同分割区域的方法包括以下步骤:S401.每幅图像随机选择K个初始聚类中心,对每个像素,计算其与各个聚类中心的距离,并将其分配到距离最近的聚类中心所属的簇,对每个聚类簇,计算该簇内所有像素的平均值,并更新聚类中心的位置,重复分配...

【专利技术属性】
技术研发人员:王德成
申请(专利权)人:上海仝心电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1