图像语义分割方法、系统、存储介质及电子设备技术方案

技术编号:41588697 阅读:21 留言:0更新日期:2024-06-07 00:01
本申请提供一种图像语义分割方法、系统、存储介质及电子设备,所述方法包括:获取多模态信息、第一聚类标准矩阵与第二聚类标准矩阵;所述多模态信息包括待处理图像与类别文本;基于所述待处理图像获取图像矩阵;基于所述类别文本获取类别向量;基于所述第一聚类标准矩阵对所述图像矩阵进行第一次聚类,获取第一次聚类结果;所述第一次聚类结果包括第一语义矩阵和第一聚类向量矩阵;基于所述第二聚类标准矩阵对所述第一聚类向量矩阵进行第二次聚类,获取第二次聚类结果;所述第二次聚类结果包括第二语义矩阵和第二聚类向量矩阵;基于所述第一次聚类结果、所述第二次聚类结果和所述类别向量获取图像语义分割结果。本申请能够增强语义分割效果。

【技术实现步骤摘要】

本申请属于计算机视觉领域的,特别是涉及一种图像语义分割方法、系统、存储介质及电子设备


技术介绍

1、在计算机视觉领域中,图像语义分割是一项重要技术,其旨在将图像中的每个像素分配到预定义的语义类别中。图像语义分割技术能够应用于自动驾驶、医学图像分析、智能监控等诸多场景。

2、传统的图像语义分割方法主要基于图像的像素之间的颜色、纹理等低级特征进行分割。然而,这些方法往往对于复杂的场景和变化较大的图像效果不佳。随着深度学习的发展,基于神经网络的图像语义分割技术逐渐成为主流。例如,全卷积网络(fcn)是一种经典的深度学习模型,能够端到端地将输入图像映射到像素级的语义类别,极大地提高了图像语义分割的精度和效率。

3、但是,目前的图像语义分割技术仅仅利用了图像这一单一模态,导致分割效果较差。


技术实现思路

1、本申请的目的在于提供一种图像语义分割方法、系统、存储介质及电子设备,能够增强图像语义分割效果。

2、第一方面,本申请提供一种图像语义分割方法,所述方法包括:获取多模态信息、第一本文档来自技高网...

【技术保护点】

1.一种图像语义分割方法,其特征在于,所述方法包括:

2.根据权利要求1所述的图像语义分割方法,其特征在于,基于所述待处理图像获取图像矩阵包括:

3.根据权利要求1所述的图像语义分割方法,其特征在于,基于所述类别文本获取类别向量包括:

4.根据权利要求1所述的图像语义分割方法,其特征在于,基于所述第一聚类标准矩阵对所述图像矩阵进行第一次聚类,获取第一次聚类结果包括:

5.根据权利要求1所述的图像语义分割方法,其特征在于,基于所述第二聚类标准矩阵对所述第一聚类向量矩阵进行第二次聚类,获取第二次聚类结果包括:

6.根据权利要求1所述...

【技术特征摘要】

1.一种图像语义分割方法,其特征在于,所述方法包括:

2.根据权利要求1所述的图像语义分割方法,其特征在于,基于所述待处理图像获取图像矩阵包括:

3.根据权利要求1所述的图像语义分割方法,其特征在于,基于所述类别文本获取类别向量包括:

4.根据权利要求1所述的图像语义分割方法,其特征在于,基于所述第一聚类标准矩阵对所述图像矩阵进行第一次聚类,获取第一次聚类结果包括:

5.根据权利要求1所述的图像语义分割方法,其特征在于,基于所述第二聚类标准矩阵对所述第一聚类向量矩阵进行第二次聚类,获取第二次聚类结果包括:

...

【专利技术属性】
技术研发人员:张俊杰孔欧刘益东
申请(专利权)人:上海蜜度科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1