视频生成方法、装置、终端及存储介质制造方法及图纸

技术编号：26976548 阅读：90 留言：0更新日期：2021-01-06 00:13

本申请实施例公开了一种视频生成方法、装置、终端及存储介质，属于计算机技术领域。该方法包括：获得所选取的待匹配音频对应的发音嘴型序列；获取与发音嘴型序列对应的嘴型素材图像序列；利用嘴型素材图像序列对待匹配图像进行替换融合处理，得到目标图像序列；对待匹配音频与目标图像序列进行合并编码，生成目标视频；同一时刻下，目标视频中视频帧对应的发音嘴型与音频帧对应的发音嘴型相同。本申请实施例中，通过替换待匹配图像中发音嘴型的方式生成目标图像，使目标图像的发音嘴型适配待匹配音频的内容，用户只需提供一张人脸图像就能得到人物模仿待匹配音频中音频内容的目标视频，降低了制作目标视频的成本，提高了视频生成效率。

全部详细技术资料下载

【技术实现步骤摘要】
视频生成方法、装置、终端及存储介质
本申请实施例涉及计算机
，特别涉及一种视频生成方法、装置、终端及存储介质。
技术介绍
随着计算机技术的发展，智能终端通常具有音频播放和视频拍摄功能。用户可以利用智能终端播放音频，同时开启视频拍摄功能，从而根据音频内容进行表演或模仿，例如在终端播放音乐时使其拍摄用户跟随音乐对嘴型的视频。相关技术中，终端在音频的播放起始时刻开始拍摄视频，并在音频的播放结束时刻停止拍摄，直接生成包含用户模仿画面的视频，或者在音频的播放起始时刻开始采集用户的动态图像，并将音频文件与图像文件进行编码，合成视频文件。然而，若采用相关技术中的视频生成方法，用户需要预先熟悉音频内容，并且需要根据音频内容对口型，从而达到逼真的效果，操作较为费时费力，拍摄视频的效率较低。
技术实现思路
本申请实施例提供了一种视频生成方法、装置、终端及存储介质，使得用户只需提供一张人脸图像就能得到人物模仿待匹配音频中音频内容的目标视频，从而降低制作目标视频的成本，提高视频生成效率。所述技术方案如下：一...

【技术保护点】
1.一种视频生成方法，其特征在于，所述方法包括：/n获得所选取的待匹配音频对应的发音嘴型序列；/n获取与所述发音嘴型序列对应的嘴型素材图像序列，所述嘴型素材图像序列中的嘴型素材图像与所述发音嘴型序列中的发音嘴型一一对应；/n利用所述嘴型素材图像序列对待匹配图像进行替换融合处理，得到目标图像序列，所述待匹配图像为包含嘴部的人脸图像；/n对所述待匹配音频与所述目标图像序列进行合并编码，生成目标视频；同一时刻下，所述目标视频中视频帧对应的所述发音嘴型与音频帧对应的所述发音嘴型相同。/n

【技术特征摘要】
1.一种视频生成方法，其特征在于，所述方法包括：
获得所选取的待匹配音频对应的发音嘴型序列；
获取与所述发音嘴型序列对应的嘴型素材图像序列，所述嘴型素材图像序列中的嘴型素材图像与所述发音嘴型序列中的发音嘴型一一对应；
利用所述嘴型素材图像序列对待匹配图像进行替换融合处理，得到目标图像序列，所述待匹配图像为包含嘴部的人脸图像；
对所述待匹配音频与所述目标图像序列进行合并编码，生成目标视频；同一时刻下，所述目标视频中视频帧对应的所述发音嘴型与音频帧对应的所述发音嘴型相同。

2.根据权利要求1所述的方法，其特征在于，所述获取与所述发音嘴型序列对应的嘴型素材图像序列之前，所述方法包括：
对所述待匹配图像进行图像识别，得到所述待匹配图像的人脸属性；
根据所述人脸属性从候选素材库中确定第一目标素材库，所述第一目标素材库对应的素材属性与所述人脸属性的匹配度符合第一预设匹配条件，所述候选素材库中包含同一所述素材属性下不同所述发音嘴型的所述嘴型素材图像；
所述获取与所述发音嘴型序列对应的嘴型素材图像序列，包括：
根据所述发音嘴型序列，从所述第一目标素材库中获取所述嘴型素材图像，得到所述嘴型素材图像序列。

3.根据权利要求2所述的方法，其特征在于，所述人脸属性包括第一目标年龄、目标唇形和第一目标性别中的至少一种，所述素材属性包括素材年龄区间、素材唇形和素材性别中的至少一种；
所述第一预设匹配条件包括：
所述第一目标性别与所述素材性别相同；
和/或，所述第一目标年龄属于所述素材年龄区间；
和/或，所述目标唇形与所述素材唇形的相似度大于相似度阈值。

4.根据权利要求2所述的方法，其特征在于，所述方法还包括：
响应于所述匹配度不符合所述第一预设匹配条件，对所述待匹配音频进行声音识别，得到所述待匹配音频的声音属性；
根据所述声音属性从所述候选素材库中确定第二目标素材库，所述第二目标素材库对应的所述素材属性与所述声音属性的匹配度符合第二预设匹配条件；
所述获取与所述发音嘴型序列对应的嘴型素材图像序列，包括：
根据所述发音嘴型序列，从所述第二目标素材库中获取所述嘴型素材图像，得到所述嘴型素材图像序列。

5.根据权利要求4所述的方法，其特征在于，所述声音属性包括第二目标年龄和第二目标性别中的至少一种，所述素材属性包括素材年龄区间和素材性别中的至少一种；
所述第二预设匹配条件包括：
所述第二目标性别与所述素材性别相同，和/或，所述第二目标年龄属于所述素材年龄区间。

6.根据权利要求1至5任一所述的方法，其特征在于，所述利用所述嘴型素材图像序列对待匹配图像进行替换融合处理，得到目标图像序列，包括：
根据所述待匹配图像中的所述发音嘴型与所述嘴型素材图像序列中各个所述嘴型素材图像的相似度，确定各个所述嘴型素材图像的透明度，所述相似度与所述透明度呈正相关关系；
按所述透明度对所述嘴型素材图像序列中的各个所述嘴型素材图像进行透明处理；
...

【专利技术属性】
技术研发人员：刘春宇，
申请(专利权)人：广州酷狗计算机科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人