一种视频生成方法及相关装置制造方法及图纸

技术编号：25643554 阅读：41 留言：0更新日期：2020-09-15 21:35

本申请提供了一种视频生成方法及相关设备，可应用于人工智能领域中的图像处理、视频生成领域，其中，一种视频生成方法包括：接收视频生成指令，并响应于视频生成指令获取文本信息和图片信息，文本信息包括一个或多个关键字，图片信息包括N张图片；根据一个或多个关键字获取N张图片的每张图片中与一个或多个关键字对应的图像特征；将一个或多个关键字和N张图片的图像特征输入目标生成器网络中，生成目标视频，目标视频包括M张图片，M张图片为基于N张图片的图像特征生成的、且与所述一个或多个关键字对应的图片。实施本申请实施例，保证了视频内容的丰富性的前提下，自动生成视频。

全部详细技术资料下载

【技术实现步骤摘要】
一种视频生成方法及相关装置
本申请涉及人工智能领域，尤其涉及一种视频生成方法及相关装置。
技术介绍
状态分享是当今新媒体社会内许多用户都会使用的方式，通过状态分享可以让他人了解自己，促进人与人之间的交流。例如：微信的地理位置状态分享、说说状态分享，抖音的视频分享等，丰富的状态分享能促进社交平台友好发展，提升用户生活交友体验。然而，在社交平台上，单一的地理位置信息、文字或图片的分享使得用户间所能获取的信息较少，无法在视觉和听觉上同时满足需求。因此，为了满足用户在视觉上和听觉上的需求，可以拍摄视频后再分享。然而，拍摄视频后再分享，给用户带来一定的不便，需要耗费用户一定的时间进行手动摄影，而且拍摄的视频质量和内容，也很容易受到用户拍摄技术和拍摄条件的限制。如果直接利用图片合成视频，只局限于以幻灯片的形式切换式放映，缺少内容的丰富性。因此，如何在保证视频内容的丰富性的前提下，自动生成视频，是亟待解决的问题。
技术实现思路
本申请实施例提供一种视频生成方法及相关装置，能够根据文本和图片生成视频，以便...

【技术保护点】
1.一种视频生成方法，其特征在于，包括：/n接收视频生成指令，并响应于所述视频生成指令获取文本信息和图片信息，所述文本信息包括一个或多个关键字，所述图片信息包括N张图片，N为大于或等于1的正整数；/n根据所述一个或多个关键字获取所述N张图片中与所述一个或多个关键字对应的图像特征；/n将所述一个或多个关键字和所述N张图片的图像特征输入目标生成器网络中，生成目标视频，所述目标视频包括M张图片，所述M张图片为基于所述图像特征生成的、且与所述一个或多个关键字对应的图片，M为大于1的正整数。/n

【技术特征摘要】
1.一种视频生成方法，其特征在于，包括：
接收视频生成指令，并响应于所述视频生成指令获取文本信息和图片信息，所述文本信息包括一个或多个关键字，所述图片信息包括N张图片，N为大于或等于1的正整数；
根据所述一个或多个关键字获取所述N张图片中与所述一个或多个关键字对应的图像特征；
将所述一个或多个关键字和所述N张图片的图像特征输入目标生成器网络中，生成目标视频，所述目标视频包括M张图片，所述M张图片为基于所述图像特征生成的、且与所述一个或多个关键字对应的图片，M为大于1的正整数。

2.根据权利要求1所述方法，其特征在于，所述响应于所述视频生成指令获取文本信息，包括：
响应于所述视频生成指令，从文本输入信息、语音输入信息、用户偏好信息、用户生理数据信息、当前环境信息中的一个或多个，获取所述文本信息，其中，所述当前环境信息包括当前天气信息、当前时间信息、当前地理位置信息中的一个或多个。

3.根据权利要求1或2所述方法，其特征在于，所述响应于所述视频生成指令获取图片信息，包括：
响应于所述视频生成指令，从预先存储的多张图片中，获取与所述一个或多个关键字中至少一个关键字对应的图片。

4.根据权利要求1或2所述方法，其特征在于，所述视频生成指令包括人脸识别请求；所述响应于所述视频生成指令获取图片信息，包括：
响应于所述视频生成指令，进行人脸识别并获得人脸识别结果；
根据所述人脸识别结果，从预先存储的多张图片中，获取与所述人脸识别结果匹配的至少一张图片。

5.根据权利要求1或2所述方法，其特征在于，所述视频生成指令包括至少一个图片标签，所述至少一个图片标签中每一个图片标签与预先存储的多张图片中的至少一张图片对应；所述响应于所述视频生成指令获取图片信息，包括：
响应于所述视频生成指令，根据所述至少一个图片标签，从预先存储的多张图片中，获取与所述至少一个图片标签中每一个图片标签对应的至少一张图片。

6.根据权利要求3-5所述的任意一项方法，其特征在于，所述获取的所述N张图片中每张图片的图片质量均大于预设阈值。

7.根据权利要求1-5所述的任意一项方法，其特征在于，所述方法还包括：
将获取的所述N张图片进行图片质量评分，获得所述N张图片中每张图片对应的图片质量评分结果；
将所述图片质量评分结果小于预设阈值的图片进行图片质量增强处理，并将图片质量增强后的图片更新至所述N张图片中。

8.根据权利要求1-7所述的任意一项方法，其特征在于，所述将所述一个或多个关键字和所述N张图片的图像特征输入目标生成器网络中，生成目标视频，包括：
提取所述一个或多个关键字中每一个关键字在向量空间上对应的第一空间变量；
提取所述N张图片的图像特征分别在向量空间上对应的第二空间变量；
将所述第一空间变量和所述第二空间变量输入所述目标生成器网络中，生成所述目标视频。

9.根据权利要求1-8所述的任意一项方法，其特征在于，所述方法还包括：
获取样本文本信息、样本图片信息以及真实视频数据集，并构建判别器网络和基于视频生成的生成器网络；
将所述样本文本信息和所述样本图片信息输入所述生成器网络中，生成样本视频；
将所述样本视频和所述真实视频数据集作为所述判别器网络的输入，获得判别损失结果，其中，在所述样本视频属于所述真实视频数据集时，所述判别损失结果为1；
根据所述判别损失结果，训练所述生成器网络获得所述目标生成器网络。

10.一种视频生成装置，其特征在于，包括：
接收响应单元，用于接收视频生成指令，并响应于所述视频生成指令获取文本信息和图片信息，所述文本信息包括一个或多个关键字，所述图片信息包括N张图片，N为大于或等于1的正整数；
提取单元，用于根据所述一个或多个关键字获取所述N张图片的每张图片中与所述一个或多个关键字对应的图像特征；
生成单元，用于将所述一个或多个关键字和所述N张图片的图像特...

【专利技术属性】
技术研发人员：邵滨，岳俊，钱莉，许松岑，黄雪妍，刘亚娇，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人