视频的抠像方法、装置、计算设备及存储介质制造方法及图纸

技术编号：37583947 阅读：16 留言：0更新日期：2023-05-15 07:57

本申请实施例公开一种视频的抠像方法、装置、计算设备及存储介质，其中，视频的抠像方法，包括：获得待抠像的视频中的图像帧T；判断图像帧T是否为首帧图像；如果否，将图像帧T和视频的图像帧T

全部详细技术资料下载

【技术实现步骤摘要】
视频的抠像方法、装置、计算设备及存储介质

[0001]本申请涉及图像处理
，具体而言，涉及一种视频的抠像方法、装置、计算设备及存储介质。

技术介绍

[0002]随着抠像技术的发展，目前，已经从云端发展到移动端，从处理单张的图像到处理视频的抠像。然而，在视频抠像中，如果用单张抠像的技术去处理视频的抠像，通常易遇到预测结果(即：有的图像帧的抠像结果)闪烁的问题。其原因是越快的抠像模型通常越小，而越小的抠像模型通常不能够像云端的大模型那样做到抠像的高精度，因此，只要有一帧没有抠好，可能就会看起来闪烁，观看体验变差。因此，视频抠像的稳定性的问题是视频抠像中需要解决的问题。
[0003]相关技术中，处理视频抠像稳定性的方式通常是采用图像后处理技术，例如：对抠像结果运用投票方式或是高斯平滑之类的稳像算法，让抠像结果看起来更加稳定，存在如下缺点：需要进行图像的后处理，因此，计算成本较高，对计算资源的消耗较大。

技术实现思路

[0004]针对上述现有技术中存在的问题，本申请实施例提供了一种视频的抠像方法、装置、计算设备及存储介质，可以有效降低计算成本的同时提升视频抠像的稳定性。
[0005]第一方面，本申请实施例提供了一种视频的抠像方法，包括：
[0006]获得待抠像的视频中的图像帧T，所述T为正整数；
[0007]判断所述图像帧T是否为所述视频的首帧图像；
[0008]如果否，则将所述图像帧T和所述视频的图像帧T
‑
1的抠像推理参数输入抠像模型中，得到...

【技术保护点】

【技术特征摘要】
1.一种视频的抠像方法，其特征在于，包括：获得待抠像的视频中的图像帧T，所述T为正整数；判断所述图像帧T是否为所述视频的首帧图像；如果否，则将所述图像帧T和所述视频的图像帧T
‑
1的抠像推理参数输入抠像模型中，得到所述图像帧T的抠像图，其中，所述抠像模型包括编码模块、ConvGRU时序模块和解码模块，所述编码模块对所述图像帧T进行编码得到编码结果，所述ConvGRU时序模块根据输入的所述图像帧T的编码结果和所述图像帧T
‑
1的抠像推理参数得到所述图像帧T的抠像推理参数，所述解码模块对所述图像帧T的抠像推理参数进行解码得到所述图像帧T的抠像图。2.根据权利要求1所述的视频的抠像方法，其特征在于，还包括：如果所述图像帧T为所述视频的首帧图像，则将所述图像帧T输入所述抠像模型中，得到所述抠像模型的ConvGRU时序模块输出的所述图像帧T的抠像推理参数，并得到所述抠像模型的解码模块输出的图像帧T的抠像图。3.根据权利要求1或2所述的视频的抠像方法，其特征在于，还包括：如果所述图像帧T为所述视频的尾帧图像，则在得到所述图像帧T的抠像图之后，退出所述视频的抠像流程。4.根据权利要求1或2所述的视频的抠像方法，其特征在于，所述编码模块包括多个卷积网络，所述图像帧T依次通过所述多个卷积网络进行卷积操作，得到所述图像帧T的特征数据，并将所述特征数据作为所述编码结果输入所述抠像模型的ConvGRU时序模块。5.根据权利要求1或2所述的视频的抠像方法，其特征在于，所述解码模块对所述ConvGRU时序模块输出的所述图像帧T的抠像推理参数进行反卷积和融合操作，得到所述...

【专利技术属性】
技术研发人员：陈信宇，
申请(专利权)人：深圳万兴软件有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人