一种视觉语义分割方法、系统、电子设备及介质技术方案

技术编号：40959670 阅读：84 留言：0更新日期：2024-04-18 20:37

本发明专利技术公开一种视觉语义分割方法、系统、电子设备及介质，涉及计算机视觉技术领域。所述方法包括：基于因子退火策略和当前迭代次数得到当前迭代次数下的组合因子；根据训练集、当前迭代次数对应的组合因子和上一迭代次数下的分类模型得到当前迭代次数下的不平衡解耦组合损失函数值；根据损失函数值计算当前迭代次数下分类模型的参数梯度；根据梯度对上一迭代次数下分类模型的参数进行优化得到当前迭代次数下的分类模型，执行预设迭代次数后，得到不平衡像素级分类模型；采用不平衡像素级分类模型对待预测数据进行处理得到语义分割结果。本发明专利技术可以得到性能良好的不平衡像素级分类模型，提高语义分割任务中少数类像素的准确识别。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机视觉，特别是涉及一种视觉语义分割方法、系统、电子设备及介质。

技术介绍

1、计算机视觉领域中，语义分割（semantic segmentation）任务是指对图像或视频帧进行理解，通过像素级分类实现语义区域的标注和预测，从而获得相较目标检测等任务中更为精细的边界。类别不平衡是指在数据集中大多数样本属于某些类别，而少数属于其他类的现象，这在语义分割任务中天然存在，尤其对于分布较少或目标区域较小的类别，其像素样本相对其他类别显著稀缺。

2、标准的语义分割任务像素级分类模型训练过程一般基于误差率设计优化目标，常使用交叉熵等函数构造替代损失，例如：针对语义分割任务，现有学者提出公开号为cn113065578a的一种基于双路区域注意力编解码的图像视觉语义分割方法，对所提出的像素级分类模型以二值交叉熵损失函数和交并比损失函数的组合损失函数为优化目标进行训练，实现像素级分类并获得语义分割图，还有学者提出公开号为cn117058387a的一种基于监控场景的视频语义分割方法以及系统，对关键帧图像和非关键帧图像分别进行直接特...

【技术保护点】

1.一种视觉语义分割方法，其特征在于，包括：

2.根据权利要求1所述的视觉语义分割方法，其特征在于，采用不平衡像素级分类模型对所述待预测数据进行处理得到所述待预测数据对应的语义分割结果，具体包括：

3.根据权利要求1所述的视觉语义分割方法，其特征在于，根据所述训练集、上一迭代次数下的分类模型和当前迭代次数下的组合因子得到当前迭代次数下的不平衡解耦组合损失函数值，具体包括：

4.根据权利要求2所述的视觉语义分割方法，其特征在于，当所述待预测数据为视频时，提取所述待预测数据中的多个关键帧具体包括：

5.一种视觉语义分割系统，其特征在于，包括：<...

【技术特征摘要】

1.一种视觉语义分割方法，其特征在于，包括：

4.根据权利要求2所述的视觉语义分割方法，其特征在于，当所述待预测数据为视频时，提取所述待预测数据中的多个关键帧具体包括：

5.一种视...

【专利技术属性】
技术研发人员：李晓军，苏逸，姚俊萍，焦怡博，
申请(专利权)人：中国人民解放军火箭军工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人