一种基于二分图匹配的语义分割patch融合方法及装置制造方法及图纸

技术编号:42307096 阅读:25 留言:0更新日期:2024-08-14 15:53
本发明专利技术提供了一种基于二分图匹配的语义分割patch融合方法及装置,属于语义分割领域;解决了基于Transformer的语义分割模型在patch划分时出现的局部不连续性导致模型精度差的问题;包括以下步骤:将输入图片划分为一系列patch,得到初始的未经融合的patch集合;为所有的patch添加编号索引;将偶数编号索引的patch划分到集合A,将奇数编号索引的patch划分到集合B;使用相似度算法对patch之间的相似度进行度量,判断集合A与集合B中的patch的匹配情况;通过加权求和的方式将集合A与集合B中相似度最高的patch进行融合;本发明专利技术应用于语义分割的patch融合。

【技术实现步骤摘要】

本专利技术提供了一种基于二分图匹配的语义分割patch融合方法及装置,属于语义分割。


技术介绍

1、语义分割技术是图像分割的一种高级形式,其目的在于将图像细分为多个物体或区域,并对每个像素进行详细的分类,标记为属于特定物体或区域的类别。语义分割还广泛应用于机器人视觉、遥感图像分析、实时视频分析以及虚拟增强现实等领域。

2、语义分割技术作为计算机视觉领域的一颗璀璨明珠,近年来受到了广泛关注和深入研究。随着人工智能技术的飞速发展,尤其是深度学习技术的日新月异,语义分割技术也在不断突破和创新。而在这其中,transformer模型的崛起无疑为语义分割领域带来了新的机遇和挑战。

3、传统的语义分割方法主要依赖于卷积神经网络,通过逐层卷积和池化操作来提取图像的特征。然而,这些方法在处理全局上下文信息和长距离依赖关系时存在一定的局限性。由于卷积操作的局部性,cnn往往难以捕获到图像中远距离像素之间的关联。而语义分割任务往往需要考虑到图像的整体结构和上下文信息,这就对模型的全局建模能力提出了更高的要求。

4、相比之下,transfor本文档来自技高网...

【技术保护点】

1.一种基于二分图匹配的语义分割patch融合方法,其特征在于:所述方法用于以Transformer为基础架构的语义分割模型中,包括以下步骤:

2.根据权利要求1所述的一种基于二分图匹配的语义分割patch融合方法,其特征在于:步骤S4中的相似度算法采用余弦距离或皮尔逊相关系数进行相似度的度量。

3.根据权利要求2所述的一种基于二分图匹配的语义分割patch融合方法,其特征在于:选择皮尔逊相关系数作为默认的相似度算法。

4.一种基于二分图匹配的语义分割装置,其特征在于:包括以Transformer为基础架构的语义分割模型,所述语义分割模型中包括PLF模...

【技术特征摘要】

1.一种基于二分图匹配的语义分割patch融合方法,其特征在于:所述方法用于以transformer为基础架构的语义分割模型中,包括以下步骤:

2.根据权利要求1所述的一种基于二分图匹配的语义分割patch融合方法,其特征在于:步骤s4中的相似度算法采用余弦距离或皮尔逊相关系数进行相似度的度量。

3.根据权利要求2所述的一种基于二分图匹配的语义分割patch融合方法,其特征在于:选择皮尔逊相关系数作为默认的相似度算法。<...

【专利技术属性】
技术研发人员:刘萍张华栋田帅杰郝戍峰高宇冉宇龙
申请(专利权)人:太原理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1