用于生成视频的方法和装置制造方法及图纸

技术编号：27408907 阅读：28 留言：0更新日期：2021-02-21 14:23

本公开的实施例公开了用于生成音频的方法和装置。该方法的一具体实施方式包括：获取从音频提取的声学特征；根据声学特征，确定目标人针对音频的人脸关键点，其中，音频不属于目标人的音频；根据人脸关键点，生成目标人的视频。该实施方式实现了从给定音频到视频之间的便捷转换。的便捷转换。的便捷转换。

全部详细技术资料下载

【技术实现步骤摘要】
用于生成视频的方法和装置

[0001]本公开的实施例涉及计算机
，具体涉及用于生成视频的方法和装置。

技术介绍

[0002]近些年来，涌现出了一大批信息流类应用以通过信息流页面向用户提供文本、音频、视频、图像等各种类型的大量信息，另外还包括一大批教育或娱乐交互类应用以提供用户各种有趣的功能。而这些应用的一个主要特点就是其中大量的内容都是用户生成的，每个用户都可以自己制作视频、图像等各种内容并上传，同时也可以浏览其它用户制作的内容。
[0003]基于用户的各种内容制作需求，这些应用平台不断开发并推出各种功能的服务。其中，利用多模态技术提供信息之间的类型转换等功能服务是正在研究和发展的一个应用方向。例如，一些应用平台已经提供了可以将语音直接转成文字、将文字直接转成语音、更换视频中的配音人员的性别、为视频自动添加音频、为音频自动添加视频等各种功能服务。

技术实现思路

[0004]本公开的实施例提出了用于生成视频的方法和装置。
[0005]第一方面，本公开的实施例提供了一种用于生成视频的方法，该...

【技术保护点】

【技术特征摘要】
1.一种用于生成视频的方法，包括：获取从音频提取的声学特征；根据所述声学特征，确定目标人针对所述音频的人脸关键点，其中，所述音频不属于所述目标人的音频；根据所述人脸关键点，生成所述目标人的视频。2.根据权利要求1所述的方法，其中，所述方法还包括：为所述视频添加所述不属于所述目标人的音频。3.根据权利要求1所述的方法，其中，所述根据所述声学特征，确定目标人针对所述音频的人脸关键点，包括：将所述声学特征输入至预先训练的、所述目标人对应的关键点确定模型，得到所述目标人针对所述音频的人脸关键点。4.根据权利要求3所述的方法，其中，所述关键点确定模型包括特征转换模型和预测模型，其中，所述特征转换模型用于将声学特征转换为对应的文本特征，所述预测模型用于根据文本特征确定所述目标人的人脸关键点。5.根据权利要求1-4之一所述的方法，其中，所述人脸关键点包括至少一组人脸关键点，且每组人脸关键点用于表征一帧人脸图像。6.根据权利要求5所述的方法，其中，所述根据所述人脸关键点，生成所述目标人的视频，包括：生成所述至少一组人脸关键点中的各组人脸关键点分别对应的人脸图像，得到人脸图像集；利用所述人脸图像集生成所述目标人的视频...

【专利技术属性】
技术研发人员：汤本来，谢添翼，万源，
申请(专利权)人：北京有竹居网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人