视频生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号：32233985 阅读：24 留言：0更新日期：2022-02-09 17:38

本发明专利技术实施例提供一种视频生成方法、装置、电子设备及存储介质，该方法包括：将目标音频文件划分为N个音频子片段，N为大于或者等于2的整数；在与目标音频文件关联的多个图像片段中，获取N个音频子片段中的每个音频子片段分别对应的目标图像片段，目标图像片段为与音频子片段匹配度最高的图像片段；根据N个音频子片段，对N个目标图像片段进行对应修改；根据N个音频子片段和修改后的目标图像片段，生成目标视频。本发明专利技术通过为音频子片段筛选出更为匹配的图像片段，并对筛选出的图像片段进行修改，可以实现减小修改幅度，提升修改效率，且可使得修改后的图像片段与音频子片段更加契合，提升了目标视频的播放效果。提升了目标视频的播放效果。提升了目标视频的播放效果。

全部详细技术资料下载

【技术实现步骤摘要】
视频生成方法、装置、电子设备及存储介质

[0001]本专利技术涉及计算机
，尤其涉及一种视频生成方法、装置、电子设备及存储介质。

技术介绍

[0002]随着计算机技术的发展，人们可以根据需求依据音频对图像序列进行修改，以将修改后的图像序列配合音频播放。相比于单独播放音频，图像序列配合音频进行播放的方式，可以增强趣味性，优化用户的视听体验。
[0003]现有技术中，在根据音频修改图像序列时，需要根据音频对现有图像序列做局部修改，音频与图像序列中某帧图像的对应关系是根据音频和图像序列的播放顺序配置的，如果音频期望的画面与原图像对应的画面差距太大，则修改幅度较大，容易出现修改不到位，修改后的效果不理想的问题。
[0004]由此可见，现有技术中，在基于音频进行图像修改时，容易修改不到位，导致修改后的图像序列与音频的匹配效果不佳。

技术实现思路

[0005]本专利技术实施例提供了一种视频生成方法、装置、电子设备及存储介质，以解决现有技术中在基于音频进行图像修改时，存在的容易修改不到位，导致修改后的...

【技术保护点】

【技术特征摘要】
1.一种视频生成方法，其特征在于，包括：将目标音频文件划分为N个音频子片段，N为大于或者等于2的整数；在与所述目标音频文件关联的多个图像片段中，获取所述N个音频子片段中的每个所述音频子片段分别对应的目标图像片段，所述目标图像片段为与所述音频子片段匹配度最高的图像片段；根据所述N个音频子片段，对N个所述目标图像片段进行对应修改；根据所述N个音频子片段和修改后的N个所述目标图像片段，生成目标视频。2.根据权利要求1所述的方法，其特征在于，所述获取所述N个音频子片段中的每个所述音频子片段分别对应的目标图像片段，包括：针对所述N个音频子片段中的每个所述音频子片段，获取所述音频子片段对应的预测图像表征向量；针对所述多个图像片段中的每个所述图像片段，获取所述图像片段对应的图像表征向量；根据N个所述预测图像表征向量以及所述多个图像片段对应的多个图像表征向量，获取每个所述音频子片段分别对应的目标图像片段。3.根据权利要求2所述的方法，其特征在于，所述根据N个所述预测图像表征向量以及所述多个图像片段对应的多个图像表征向量，获取每个所述音频子片段分别对应的目标图像片段，包括：针对每个所述预测图像表征向量，在所述多个图像片段对应的多个图像表征向量中，根据向量距离确定与当前预测图像表征向量匹配度最高的目标图像表征向量；将所述目标图像表征向量对应的图像片段，确定为当前预测图像表征向量对应的音频子片段的目标图像片段。4.根据权利要求2所述的方法，其特征在于，所述针对所述N个音频子片段中的每个所述音频子片段，获取所述音频子片段对应的预测图像表征向量，包括：将所述N个音频子片段输入表征向量预测模型，获取每个所述音频子片段对应的预测图像表征向量；所述针对所述多个图像片段中的每个所述图像片段，获取所述图像片段对应的图像表征向量，包括：将所述多个图像片段输入表征向量预测模型，获取每个所述图像片段对应的图像表征向量。5.根据权利要求1所述的方法，其特征在于，所述目标图像片段包括目标人物，所述根...

【专利技术属性】
技术研发人员：王愈，李健，武卫东，陈明，
申请(专利权)人：北京捷通华声科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人