一种视频生成方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号：31229981 阅读：28 留言：0更新日期：2021-12-08 10:00

本申请提供了一种视频生成方法、装置、设备及计算机可读存储介质；涉及人工智能技术；该方法包括：获取当前时间步对应的历史视频帧序列；对历史视频帧序列中的最后一个视频帧进行特征编码，得到最后一个视频帧对应的图形特征；依据历史视频帧序列，预测出当前时间步对应的位置特征；对位置特征和图形特征进行特征对准处理，得到待解码特征；其中，待解码特征描述了当前时间步时移动对象的出现区域，以及移动对象的外观在最后一个视频帧中的出现区域；对待解码特征进行特征解码，得到当前时间步的预测视频帧。通过本申请，能够提高生成的视频的质量。的质量。的质量。

全部详细技术资料下载

【技术实现步骤摘要】
一种视频生成方法、装置、设备及计算机可读存储介质

[0001]本申请涉及人工智能领域的计算机视觉技术，尤其涉及一种视频生成方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]视频生成是人工智能的一个重要方向。视频生成可以分为两个类别：确定性视频生成和随机视频生成。随机视频生成可以生成多个未来状态各不相同，且运动合理的视频序列，其通过引入隐变量来解释视频序列中复杂的随机现象。
[0003]然而，相关技术中，随机视频生成可能会出现特征错位，即使得视频中的移动对象的外观丢失，从而构建出的未来时间步的外观特征会存在模糊，最终导致生成的视频的质量较低。

技术实现思路

[0004]本申请实施例提供一种视频生成方法、装置、设备及计算机可读存储介质，能够提高生成的视频的质量。
[0005]本申请实施例的技术方案是这样实现的：
[0006]本申请实施例提供一种视频生成方法，包括：
[0007]获取当前时间步对应的历史视频帧序列；
[0008]对所述历史视频帧序列中的最后一个视频...

【技术保护点】

【技术特征摘要】
1.一种视频生成方法，其特征在于，包括：获取当前时间步对应的历史视频帧序列；对所述历史视频帧序列中的最后一个视频帧进行特征编码，得到所述最后一个视频帧对应的图形特征；依据所述历史视频帧序列，预测出所述当前时间步对应的位置特征；对所述位置特征和所述图形特征进行特征对准处理，得到待解码特征；其中，所述待解码特征描述了所述当前时间步时移动对象的出现区域，以及所述移动对象的外观在所述最后一个视频帧中的出现区域；对所述待解码特征进行特征解码，得到所述当前时间步的预测视频帧。2.根据权利要求1所述的方法，其特征在于，所述对所述位置特征和所述图形特征进行特征对准处理，得到待解码特征，包括：基于所述位置特征和所述图形特征，构建出注意力图；依据所述注意力图和所述位置特征，确定出用于描述所述移动对象所在的区域的上下文信息的对准特征；利用所述对准特征、所述位置特征和所述图形特征，融合成所述待解码特征。3.根据权利要求2所述的方法，其特征在于，所述基于所述位置特征和所述图形特征，构建出注意力图，包括：将所述位置特征映射到第一预设特征空间，得到第一映射特征图，以及将所述图形特征映射到所述第一预设特征空间，得到第二映射特征图；针对所述第一映射特征图中的每个空间位置，从所述第一映射特征图中提取第一空间向量；对所述第二映射特征图中，与所述每个空间位置对应的多个目标位置进行空间向量的提取，得到多个第二空间向量；依据所述第一空间向量分别与所述多个第二空间向量的相似程度，构建出所述注意力图。4.根据权利要求3所述的方法，其特征在于，所述依据所述第一空间向量分别与所述多个第二空间向量的相似程度，构建出所述注意力图，包括：将所述第一空间向量分别和所述多个第二空间向量进行相似度计算，得到所述多个第二空间向量对应的多个相似度分数；对所述多个相似度分数分别进行归一化，得到所述多个第二空间向量对应的多个归一化分数；利用所述多个归一化分数，组成所述每个空间位置对应的注意力向量；利用所述每个空间位置对应的注意力向量，形成所述注意力图。5.根据权利要求3或4所述的方法，其特征在于，所述多个目标位置包括：与所述每个空间位置处于同一行的各个位置，以及与所述每个空间位置处于同一列的各个位置。6.根据权利要求2至4任一项所述的方法，其特征在于，所述依据所述注意力图和所述位置特征，确定出用于描述所述移动对象所在的区域的上下文信息的对准特征，包括：将所述位置特征映射到第二预设特征空间，得到第三映射特征图；针对所述第三映射特征图中的每个像素位置，从所述第三映射特征图中抽出多个第三
空间向量；利用所述多个第三空间向量，组成所述每个像素位置对应的特征集合；对所述特征集合和所述注意力图进行矩阵运算，得到用于描述所述移动对象所在的区域的上下文信息的所述对准特征。7.根据权利要求6所述的方法，其特征在于，所述针对所述第三映射特征图中的每个像素位置，从所述第三映射特征图中抽出多个第三空间向量，包括：对所述第三映射特征图中与所述每个像素位置处于同行同列的位置进行筛选，得到多个待抽取位置；对所述多个待抽取位置进行空间向量的抽取，得到所述每个像素位置对应的所述多个第三空间向量。8.根据权利要求6所述的方法，其特征在于，所述将所述位置特征映射到第二预设特征空间，得到第三映射特征图，包括：利用所述第二预设特征空间对应的卷积核，对所述位置特征进行卷积操作实现映射，得到所述第三映射特征图。9.根据权利要求1至4任一项所述的方法，其特征在于，所述依据所述历史视频帧序列，预测出所述当前时间步对应的位置特征，包括：对所述历史视频帧序列进行特征编码，得到历史视频特征；利用预设先验分布推测模型，从所述历史视频特征中学习出所...

【专利技术属性】
技术研发人员：李毛毛，李志鋒，刘威，王珏，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人