图像语义分割方法、装置、设备和可读存储介质制造方法及图纸

技术编号：26035373 阅读：67 留言：0更新日期：2020-10-23 21:13

本申请实施例公开了一种图像语义分割方法、装置、设备和可读存储介质，涉及人工智能、图像处理和深度学习技术领域。具体实现方案为：获取当前视频帧；提取所述当前视频帧中目标对象的第一轮廓；对所述目标对象的第一轮廓与所述当前视频帧的历史视频帧中所述目标对象的第二轮廓进行轮廓匹配，得到所述当前视频帧中的匹配一致轮廓；对所述匹配一致轮廓与所述当前视频帧中目标对象的语义分割结果进行融合，得到最终的语义分割结果。本申请实施例能够提高图像分割精度。

全部详细技术资料下载

【技术实现步骤摘要】
图像语义分割方法、装置、设备和可读存储介质
本申请涉及计算机技术，尤其涉及人工智能、图像处理和深度学习

技术介绍
语义分割算法是根据图像中各物体的统计特征，将不同的类别物体所占有的区域进行划分。在实际应用中，大量场景中存在临近物体纹理或颜色相似的情况，这使得物体间的边界处难以区分，加大了语义分割算法进行区域划分的难度，使得边界处极易出现误分割问题。目前，一般采用数据增强类方法解决误分割的问题，具体通过采集或模拟生成目标场景相近的数据，让算法模型适应此类分割问题的数据特征分割来改善误分割问题。但是数据增强类算法需要采集大量与问题场景相近的图片数据并进行标注，耗费时间长、标注成本昂贵，且适用性有限，当问题场景改变时又需要进行新的数据采集、标注、模型训练，无法从根本上解决误分割问题；而且精度有限。
技术实现思路
本申请实施例提供了一种图像语义分割方法、装置、设备和可读存储介质。第一方面，本申请实施例提供了一种图像语义分割方法，包括：获取当前视频帧；提取所述当前视频帧中目标对象的第一轮廓；对所述目标对象的第一轮廓与所述当前视频帧的历史视频帧中所述目标对象的第二轮廓进行轮廓匹配，得到所述当前视频帧中的匹配一致轮廓；对所述匹配一致轮廓与所述当前视频帧中目标对象的语义分割结果进行融合，得到最终的语义分割结果。第二方面，本申请实施例还提供了一种图像语义分割装置，包括：获取模块，用于获取当前视频帧；提取模块，用于提取所述当前视频帧中目...

【技术保护点】
1.一种图像语义分割方法，包括：/n获取当前视频帧；/n提取所述当前视频帧中目标对象的第一轮廓；/n对所述目标对象的第一轮廓与所述当前视频帧的历史视频帧中所述目标对象的第二轮廓进行轮廓匹配，得到所述当前视频帧中的匹配一致轮廓；/n对所述匹配一致轮廓与所述当前视频帧中目标对象的语义分割结果进行融合，得到最终的语义分割结果。/n

【技术特征摘要】
1.一种图像语义分割方法，包括：
获取当前视频帧；
提取所述当前视频帧中目标对象的第一轮廓；
对所述目标对象的第一轮廓与所述当前视频帧的历史视频帧中所述目标对象的第二轮廓进行轮廓匹配，得到所述当前视频帧中的匹配一致轮廓；
对所述匹配一致轮廓与所述当前视频帧中目标对象的语义分割结果进行融合，得到最终的语义分割结果。

2.根据权利要求1所述的方法，其中，所述对所述目标对象的第一轮廓与所述当前视频帧的历史视频帧中所述目标对象的第二轮廓进行轮廓匹配，得到所述当前视频帧中匹配一致轮廓，包括：
离散化所述第一轮廓和所述第二轮廓，分别得到第一点序列和第二点序列；
采用第二点序列对所述第一点序列进行点集配准，得到所述第一点序列中匹配一致的点序列，作为所述匹配一致轮廓。

3.根据权利要求2所述的方法，其中，所述采用第二点序列对所述第一点序列进行点集配准，得到所述第一点序列中匹配一致的点序列，作为所述匹配一致轮廓，包括：
对所述第二点序列进行仿射变换，得到估计点序列；
采用混合高斯模型的概率密度函数描述所述估计点序列与所述第一点序列的配准程度；
最大化所述概率密度函数，得到所述第一点序列中与所述估计点序列匹配一致的点序列，作为所述匹配一致轮廓。

4.根据权利要求1所述的方法，其中，所述对所述匹配一致轮廓与所述当前视频帧中目标对象的语义分割结果进行融合，得到最终的语义分割结果，包括：
基于所述语义分割结果，获取所述匹配一致轮廓上的点属于所述目标对象的原始置信度；
基于所述轮廓匹配，确定所述匹配一致轮廓上的点属于所述目标对象的匹配置信度；
综合所述原始置信度和所述匹配置信度，筛选出所述匹配一致轮廓上属于所述目标对象的目标点集；
汇总所述目标对象语义分割结果中除所述匹配一致轮廓外的剩余点集与所述目标点集，得到最终的语义分割结果。

5.根据权利要求1所述的方法，在所述对所述目标对象的第一轮廓与所述当前视频帧的历史视频帧中所述目标对象的第二轮廓进行轮廓匹配，得到所述当前视频帧中的匹配一致轮廓之前，还包括：
对所述历史视频帧进行语义分割和轮廓提取，得到所述目标对象的第二轮廓；或者，
对所述历史视频帧中的匹配一致轮廓与所述历史视频帧中目标对象的语义分割结果进行融合，得到所述目标对象的第二轮廓。

6.根据权利要求1-5任一项所述的方法，其中，所述历史视频帧为所述当前视频帧的前一帧。

7.一种图像语义分割装置，包括：
获取模块，用于获取当前视频帧；
提取模块，用于提取所述当前视频帧中目标对象的第一轮廓；
匹配模块，用于对所述目标对象的第一轮廓与所述当前视频帧的历史视频...

【专利技术属性】
技术研发人员：郭汉奇，洪智滨，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人