一种视频人像的分割、装置、计算机和存储介质制造方法及图纸

技术编号：37227203 阅读：12 留言：0更新日期：2023-04-20 23:10

本发明专利技术公开一种视频人像的分割方法，包括：对视频进行解析得到视频图像，并提取视频图像的浅层特征和深层特征；对深层特征进行信息融合得到第一多维深层特征，对深层特征依次进行池化、卷积、sigmoid和双线性插值计算后放大处理得到第二多维深层特征，将第一多维深层特征和第二多维深层特征进行融合得到深层输出特征；将浅层特征与深层输出特征相加得到输出特征，通过DC

全部详细技术资料下载

【技术实现步骤摘要】
一种视频人像的分割、装置、计算机和存储介质

[0001]本专利技术属于图像分割
，尤其是一种视频人像的分割方法、装置、计算机和存储介质。

技术介绍

[0002]语义分割是计算机视觉中很重要的一个方向。不同于目标检测和识别，语义分割实现的是图像像素级的分类。即给每一个像素赋予一个类别，因此它能够将一张图片或者视频(视频以帧来提取的话其实就是图片)，按照类别的异同，将图像分为多个不同的区块，从而达到图像语义分割的目的。人像分割属于语义分割的一种，在图像或者视频帧中，将人体视作前景类别，将其他视作背景类别，对于整幅画面区分为两类。该技术目前有着广泛的应用，在诸如人像特效等娱乐化场景、视频会议或者直播的背景替换等等场景中都有着深度而广泛的应用。
[0003]先前的传统方案主要是灰度分割，条件随机场等一些较为传统的算法。其中，灰度分割中最简单的语义分割涉及的分配区域，必须满足一些硬编码规则或属性，以便为其分配特定标签。规则可以根据像素的属性(例如像素灰度级强度)来构建。使用此技术的一种方法是拆分(Split)和合并(Merge)算法。该算法递归地将图像分割成子区域，直到可以分配标签，然后通过合并它们将相邻的子区域与相同的标签组合，但是这种方法的问题是必须采用硬编码的方式。此外，仅用灰色级别的信息来表示复杂的类(如人像)是极其困难的。因此，需要特征提取和优化技术来正确地学习这些复杂类所需的表征方式。
[0004]条件随机场是通过训练模型为每个像素分配类别标签的方式来分割图像。如果我们的模型不完美，我们可能会...

【技术保护点】

【技术特征摘要】
1.一种视频人像的分割方法，其特征在于，包括：对视频进行解析得到视频图像，并对所述视频图像进行特征提取得到所述视频图像的浅层特征和深层特征；对所述深层特征进行信息融合得到第一多维深层特征，对所述深层特征依次进行池化、卷积、sigmoid和双线性插值计算后放大处理得到第二多维深层特征，并将所述第一多维深层特征和所述第二多维深层特征进行融合得到包含人像特征和背景特征的深层输出特征；将所述浅层特征与所述深层输出特征相加得到所述视频图像的输出特征，通过DC
‑
CE
‑
loss损失函数对所述输出特征的人像特征和背景特征进行标注，并利用标注后的数据进行模型训练得到人像分割模型；获取待分割视频图像，将所述待分割视频图像输入至所述人像分割模型中得到所述待分割视频图像的输出特征，对所述输出特征进行滤波，二值化处理以及对所述待分割图像的边缘进行平均值滤波得到所述待分割视频图像中的人像。2.根据权利要求1所述的分割方法，其特征在于，所述对所述视频图像进行特征提取得到所述视频图像的浅层特征和深层特征，包括：通过mobilenetV3网络对所述视频图像依次按照1/4、1/8、1/16倍下采样；将1/8倍下采样的特征作为所述浅层特征，将1/16倍下采样的特征作为所述深层特征。3.根据权利要求1所述的分割方法，其特征在于，对所述深层特征进行信息融合得到第一多维深层特征，具体为：利用1X1的ConvBNReLU模型对所述深层特征进行特征通道信息融合，得到128维的第一多维深层特征。4.根据权利要求1所述的分割方法，其特征在于，所述对所述深层特征依次进行池化、卷积、sigmoid和双线性插值计算后放大处理得到第二多维深层特征，包括：利用大小为49X49，滑动步长为stride＝[16,20]对所述深层特征进行平均池化；利用1X1的卷积层对平均池化后的特征进行卷积得到128维的特征，并采用sigmoid计算和双线性插值放大得到128维的第二多维特征。5.根据权利要求1所述的分割方法，其特征在于，所述将所述第一多维深层特征和所述第二多维深层特征进行融合得到包含人像特征和背景特征的深层输出特征，包括：将所述第一多维深层特征与所述第二多维深层特征进行矩阵相乘得到输出特征；对所述输出特征进行双线性插值和1X1卷积得到包含人像特征和背景特征的深层输出特征。6.根据权利要求1所述的分割方法，其...

【专利技术属性】
技术研发人员：王博，
申请(专利权)人：万兴科技湖南有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人