一种视频人物唇形检测生成的方法及装置制造方法及图纸

技术编号：28056039 阅读：32 留言：0更新日期：2021-04-14 13:26

本申请公开了一种视频人物唇形检测生成的方法及装置，包括：提取输入视频中的视频帧图像；基于所述视频帧图像的全局特征和局部特征，提取所述视频帧图像的面部区域和背景；利用预设时序数据网络模型对所述视频帧图像的面部区域和背景进行边缘提取，生成所述视频帧图像对应的唇形生成图像；对于所述唇形生成图像，利用连续帧相减法计算相邻两帧视频帧图像之间的差距，根据所述差距对所述唇形生成图像进行滤波处理；对经过滤波处理的唇形生成图像进行视频生成处理。本申请将加入阈值处理后的均值滤波平滑处理与基于深度学习的唇形特征点提取的方法相结合，基于视频的前景人物的唇形检测与生成，可广泛应用于语音识别、多媒体系统、人物识别等领域。人物识别等领域。人物识别等领域。

全部详细技术资料下载

【技术实现步骤摘要】
一种视频人物唇形检测生成的方法及装置

[0001]本申请涉及计算机视觉特征检测
，特别是涉及一种视频人物唇形检测生成的方法及装置。

技术介绍

[0002]唇形检测(Lip detection)技术是指输入为图片或视频，通过提取唇形特征信息，确认唇形特征点轨迹的检测，从而从图片或视频中将任务唇形检测的过程。唇形检测在语音识别、身份识别、多媒体系统等多个领域具有较高的应用价值。基于视频的唇形检测与基于图片的唇形检测不同，除了提取唇形特征外，还需要将唇形边缘重新生成视频。而这个过程，由于视频中不同帧间的差距会影响整体唇形生成的效果，如，容易出现抖动和不自然的现象。因此，如何减少帧间的相互影响，是基于视频的前景人物唇形生成中非常重要的部分。
[0003]针对视频中前景人物的唇形边缘检测的核心问题是如何在有效提取唇形关键点、唇形边缘以及唇形运动轨迹的前提下，能够减少相邻帧之间的相互影响，从而减少生成唇形边缘的视频中的抖动问题。
[0004]传统的唇形边缘提取并重新生成的方式是，对视频中的每一帧图像进行特征提取，从而获取特征点，依据特征点完成唇形边缘的再塑。这样处理的问题在于，当帧间像素点对应差距值过大时，生成的唇形轨迹视频会出现明显的抖动现象，尤其是在前景人物在不断地讲话过程。而如果对每一帧都进行平滑处理，会直接影响特征提取的效率。

技术实现思路

[0005]本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。
[0006]根据本申请的一个方面，提供了一种视频人物唇形...

【技术保护点】

【技术特征摘要】
1.一种视频人物唇形检测生成的方法，包括：提取输入视频中的视频帧图像；基于所述视频帧图像的全局特征和局部特征，提取所述视频帧图像的面部区域和背景；利用预设时序数据网络模型对所述视频帧图像的面部区域和背景进行边缘提取，生成所述视频帧图像对应的唇形生成图像；对于所述唇形生成图像，利用连续帧相减法计算相邻两帧视频帧图像之间的差距，根据所述差距对所述唇形生成图像进行滤波处理；对经过滤波处理的唇形生成图像进行视频生成处理。2.根据权利要求1所述的方法，其特征在于，对经过滤波处理的唇形生成图像进行视频生成处理包括：调整经过滤波处理的唇形生成图像的唇形角度，使所述唇形平面内旋转角为零；将从所述输入视频提取的音频数据与调衡后唇形生成图像进行合成，得到唇形视频。3.根据权利要求1或2所述的方法，其特征在于，对于所述唇形生成图像，利用连续帧相减法计算相邻两帧视频帧图像之间的差距，根据所述差距对所述唇形生成图像进行滤波处理包括：利用连续帧相减法计算相邻两帧视频帧图像之间的差距，当所述差距大于或者等于像素点阈值时，对所述唇形生成图像采用均值滤波处理；当所述差距小于像素点阈值时，不进行滤波处理。4.根据权利要求3所述的方法，其特征在于，采用均值滤波处理包括：利用N
×
N卷积核对相邻两帧视频帧图像之间的差距进行均值处理。5.根据权利要求1所述的方法，其特征在于，获取预设时序数据网络模型包括：利用深度学习技术，训练得到基于特征点的时序数据网络模型。6.一种视频人物唇形检测生成的装置，包括：视频图像模块，设置为提取输入视频中的视频帧图...

【专利技术属性】
技术研发人员：李欣，
申请(专利权)人：北京影谱科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人