当前位置: 首页 > 专利查询>江南大学专利>正文

基于邻域与形变注意力协同作用的食品分割方法及装置制造方法及图纸

技术编号:43001882 阅读:25 留言:0更新日期:2024-10-15 13:29
本发明专利技术涉及图像语义分割技术领域,尤其是指一种基于邻域与形变注意力协同作用的食品分割方法及装置,包括:构建食品分割模型,所述食品分割模型包括依次连接的编码器、多尺度处理器、解码器和分割器;所述编码器包括多个阶段,每个阶段包括下采样模块、多个由邻域模块和膨胀邻域模块组成的串联结构;所述多尺度处理器包括依次连接的维度一致模块、若干个多尺度可形变模块和维度恢复模块;将原始食品图像输入食品分割模型,输出目标食品分割图像。本发明专利技术使用邻域注意力和多尺度形变注意力协同作用的特征提取方式,提供了更加精细的食材决策边界,实现对食物边界和形状更有效处理。

【技术实现步骤摘要】

本专利技术涉及图像语义分割,尤其是指一种基于邻域与形变注意力协同作用的食品分割方法及装置


技术介绍

1、图片语义分割技术是计算机视觉领域的一项基础任务,是一种将图像中的每个像素进行区分和标记,使得具有相同语义的像素被分配到同一类别的技术。得益于深度学习的发展,图片语义分割在多个领域都有广泛应用,包括场景理解、自动驾驶、医疗影像分析、物体检测和跟踪等。

2、食品图片语义分割(food image semantic segmentation)任务的主要目标是在将食品图片中的食材、背景等不同部分进行像素级别的标记,用以进一步分析。这不仅可以帮助自动化餐饮管理系统识别和分类食品,还能在食品安全检测和饮食健康管理等领域发挥重要作用。

3、食品图片语义分割任务的目标是将图片中每个像素分类到预先定义的类别中,从而确定图片中每个物体的形状和大小。目前的方法主要有两种,一种是使用全卷机神经网络,将全连接层替换为卷积层,生成与输入图像相同尺寸的特征图;这种方法可以高效地处理各种食品图像,但在细节分割上可能不够精细。另一种是采用基于特征金字塔的结构通过本文档来自技高网...

【技术保护点】

1.一种基于邻域与形变注意力协同作用的食品分割方法,其特征在于,包括:

2.根据权利要求1所述的一种基于邻域与形变注意力协同作用的食品分割方法,其特征在于,对原始食品图像进行预处理,包括:

3.根据权利要求1所述的一种基于邻域与形变注意力协同作用的食品分割方法,其特征在于,所述邻域模块包括依次连接的归一化层、邻域注意力、归一化层和第一感知层;

4.根据权利要求1所述的一种基于邻域与形变注意力协同作用的食品分割方法,其特征在于,所述膨胀邻域模块包括依次连接的归一化层、空洞邻域注意力、归一化层和第二感知层;

5.根据权利要求1所述的一种基于邻域...

【技术特征摘要】

1.一种基于邻域与形变注意力协同作用的食品分割方法,其特征在于,包括:

2.根据权利要求1所述的一种基于邻域与形变注意力协同作用的食品分割方法,其特征在于,对原始食品图像进行预处理,包括:

3.根据权利要求1所述的一种基于邻域与形变注意力协同作用的食品分割方法,其特征在于,所述邻域模块包括依次连接的归一化层、邻域注意力、归一化层和第一感知层;

4.根据权利要求1所述的一种基于邻域与形变注意力协同作用的食品分割方法,其特征在于,所述膨胀邻域模块包括依次连接的归一化层、空洞邻域注意力、归一化层和第二感知层;

5.根据权利要求1所述的一种基于邻域与形变注意力协同作用的食品分割方法,其特征在于,所述将编码器中各个阶段的多尺度输出特征均输入至多尺度处理器,得到多个多尺度关键特征,包括:

【专利技术属性】
技术研发人员:张东霖李昌杏吴小俊
申请(专利权)人:江南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1