【技术实现步骤摘要】
口型合成视频校验方法、装置、计算机设备及存储介质
[0001]本专利技术涉及计算机,更具体地说是指口型合成视频校验方法、装置、计算机设备及存储介质。
技术介绍
[0002]随着视听内容消费的指数级增长,快速创建视频内容已成为一种典型需求。口型合成技术通过人物视频素材和音频可以让视频中的人物将音频内容“说”出来。口型合成视频效果依赖于提供的视频素材,当人脸区域尤其是嘴部区域出现遮挡,会严重影响合成的视频效果,所以在合成前需要对视频素材进行检查校验。
[0003]口型合成对应的音频时长越长,对应的视频时长越长。同样时长的视频,视频帧率越高,总帧数越多,每秒钟帧数越多,所显示的动作就会越流畅,帧与帧之间的画面相似度也会变高,现有技术是通过人工校验寻找问题帧,找到疑是有问题的帧,需要反复查看,才能确定到底连续哪几帧是问题帧,因为问题帧的出现是随机的,长时间通过人工寻找问题帧进行校验,会导致人的视觉疲劳,集中力下降,漏检的问题帧数量增多,最终导致工作效率降低。
[0004]因此,有必要设计一种新的方法,实现快速对合成视 ...
【技术保护点】
【技术特征摘要】
1.口型合成视频校验方法,其特征在于,包括:获取人物素材视频数据,并根据所述人物素材视频数据确定当前帧视频;对所述当前帧视频进行人脸检测,以得到人脸检测结果;判断所述人脸检测结果是否是有人脸且人脸未被遮挡;若所述人脸检测结果是有人脸且人脸未被遮挡,则截取所述当前帧视频的人脸区域;对所述人脸区域进行嘴巴检测,以得到嘴巴检测结果;判断所述嘴巴检测结果是否是嘴巴在所述人脸区域内的结果;若所述嘴巴检测结果是嘴巴不在所述人脸区域内的结果,则确定所述当前帧视频为问题帧视频,并将所述问题帧视频的序号存放于问题帧序号列表内;判断所述当前帧视频是否是所述人物素材视频数据的最后一帧视频;若所述当前帧视频不是所述人物素材视频数据的最后一帧视频,则截取下一帧视频,以形成当前帧视频,并执行所述对所述当前帧视频进行人脸检测,以得到人脸检测结果。2.根据权利要求1所述的口型合成视频校验方法,其特征在于,所述判断所述当前帧视频是否是所述人物素材视频数据的最后一帧视频之后,还包括:若所述当前帧视频是所述人物素材视频数据的最后一帧视频,根据所述问题帧序号列表确定正常帧区间列表;根据所述正常帧区间列表计算每个正常帧区间时长;根据每个正常帧区间时长进行正常帧区间时长的处理。3.根据权利要求1所述的口型合成视频校验方法,其特征在于,所述判断所述人脸检测结果是否是有人脸且人脸未被遮挡之后,还包括:若所述人脸检测结果是无人脸或人脸被遮挡,则执行所述确定所述当前帧视频为问题帧视频,并将所述问题帧视频的序号存放于问题帧序号列表内。4.根据权利要求1所述的口型合成视频校验方法,其特征在于,所述判断所述当前帧视频是否是所述人物素材视频数据的最后一帧视频,包括:判断所述当前帧视频的序号是否等于总帧数;若所述当前帧视频的序号等于总帧数,则所述当前帧视频是所述人物素材视频数据的最后一帧视频;若所述当前帧视频的序号不等于总帧数,则所述当前帧视频不是所述人物素材视频数据的最后一帧视频。5.根据权利要求2所述的口型合成视频校验方法,其特征在于,所述根据所述问题帧序号列表确定正常帧区间...
【专利技术属性】
技术研发人员:孙莉,卢庆华,黄元忠,
申请(专利权)人:深圳市木愚科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。