一种视频生成方法、装置、设备、介质、产品制造方法及图纸

技术编号:46619615 阅读:1 留言:0更新日期:2025-10-14 21:15
本申请公开了一种视频生成方法、装置、设备、介质、产品,该方法包括:在获取到参考视频和音频序列之后,先依据该音频序列中第i帧音频对应的脸部关键点、该第i帧音频在该参考视频中对应的目标图像的口型掩码结果、从该参考视频中选择的至少两帧参考图像、以及各该参考图像的脸部关键点,生成该第i帧音频对应的图像,i为正整数,i≤该音频序列中的总帧数;然后,依据该音频序列中各帧音频对应的图像,生成该音频序列对应的视频,以使该音频序列对应的视频中所呈现的对象与该参考视频中所呈现的对象保持一致,并使得该音频序列对应的视频能够表示出该对象在该音频序列下的脸部状态变化,如此有利于提高视频生成效果。

【技术实现步骤摘要】

本申请涉及数据处理,尤其涉及一种视频生成方法、装置、设备、介质、产品


技术介绍

1、对于一些应用场景,如视频中语句修改处理、或者视频中语句替换处理等场景来说,这些应用场景可能存在以下需求:依据已有的视频,生成与某个音频序列适配的视频。


技术实现思路

1、本申请提供了一种视频生成方法、装置、设备、介质、产品,有利于提高视频生成效果。

2、为了实现上述目的,本申请提供的技术方案如下:

3、本申请提供一种视频生成方法,所述方法包括:

4、获取参考视频和音频序列;

5、依据所述音频序列中第i帧音频对应的脸部关键点、所述第i帧音频在所述参考视频中对应的目标图像的口型掩码结果、从所述参考视频中选择的至少两帧参考图像、以及各所述参考图像的脸部关键点,生成所述第i帧音频对应的图像;i为正整数,i≤所述音频序列中的总帧数;

6、依据所述音频序列中各帧音频对应的图像,生成所述音频序列对应的视频。

7、在一种可能的实施方式下,所述至少两帧参考图像的确定过程,本文档来自技高网...

【技术保护点】

1.一种视频生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述至少两帧参考图像的确定过程,包括:

3.根据权利要求2所述的方法,其特征在于,所述至少两帧参考图像是依据所述采样图像、以及所述第i帧音频在所述参考视频中对应的至少一个姿态相似图像所确定的;

4.根据权利要求3所述的方法,其特征在于,各所述姿态相似图像在所述参考视频中对应的时间不同于所述第i帧音频对应的时间;

5.根据权利要求3所述的方法,其特征在于,所述第i帧音频对应的姿态表征数据是依据所述目标图像的姿态表征数据所确定的。p>

6.根据权...

【技术特征摘要】

1.一种视频生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述至少两帧参考图像的确定过程,包括:

3.根据权利要求2所述的方法,其特征在于,所述至少两帧参考图像是依据所述采样图像、以及所述第i帧音频在所述参考视频中对应的至少一个姿态相似图像所确定的;

4.根据权利要求3所述的方法,其特征在于,各所述姿态相似图像在所述参考视频中对应的时间不同于所述第i帧音频对应的时间;

5.根据权利要求3所述的方法,其特征在于,所述第i帧音频对应的姿态表征数据是依据所述目标图像的姿态表征数据所确定的。

6.根据权利要求1所述的方法,其特征在于,所述第i帧音频对应的脸部关键点包括所述音频序列中至少一帧音频的脸部关键点确定结果;

7.根据权利要求6所述的方法,其特征在于,对于所述至少一帧音频中任一音频,该音频的脸部关键点确定结果是通过将该音频对应的三维脸部关键点投影至二维平面所得到的二维脸部关键点;

8.根据权利要求7所述的方法,其特征在于,对于所述至...

【专利技术属性】
技术研发人员:张隆昊胡天舒梁爽葛志鹏唐铭谦
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1