一种配音方法和相关装置制造方法及图纸

技术编号：39261701 阅读：27 留言：0更新日期：2023-10-30 12:14

本申请公开了一种配音方法和相关装置，获取待配音视频中包括待配音的目标对象的视频帧序列，并对目标对象进行三维重建，得到每个目标视频帧分别对应的三维目标对象。基于从每个目标视频帧分别对应的三维目标对象中获取的视觉风格特征，可以生成视频帧序列对应的视觉风格序列，其中，视觉风格序列中的视觉风格特征会基于对应的目标视频帧在待配音视频中的顺序进行排列。根据视觉风格序列和用于配音的音素序列，能够确定音频特征序列，并能够通过该音频特征序列对待配音视频进行配音来得到已配音视频。通过三维目标对象能够得到在视觉角度体现待配音视频的表现风格的视觉风格序列，进而能够得到实现视觉和听觉上表现风格的相统一的已配音视频。的相统一的已配音视频。的相统一的已配音视频。

全部详细技术资料下载

【技术实现步骤摘要】
一种配音方法和相关装置

[0001]本申请涉及数据处理领域，特别是涉及一种配音方法和相关装置。

技术介绍

[0002]针对音频缺失的视频，通常需要对该视频进行配音，来得到配置有音频的视频，以便充分发挥该视频的表现力。当采用人工方式进行视频配音时，通常都需要特定的录音棚、专业的配音演员和一定的配音周期，这会导致人工方式进行视频配音的成本较大。
[0003]对此，为了控制视频配音的成本和提高视频配音的效率，相关技术主要根据相应的文本来自动合成与待配音视频对应的音频，并将该音频配置给待配音视频以实现自动配音。
[0004]虽然相关技术中的自动配音方式能够对音频缺失的待配音视频实现自动配音，但是由于自动合成的音频的表现风格通常较为单调乏味，而待配音视频的表现风格通常并不单调，即配置的音频与待配音视频本身的适配性不足，容易让查看配音视频的用户感受到配音视频在视觉和听觉上具有不同的表现风格，从而难以达到完整视频的表现力。

技术实现思路

[0005]为了解决上述技术问题，本申请提供了一种配音方法和相关装置，...

【技术保护点】

【技术特征摘要】
行、第j
‑
1列的注意力；根据所述音素序列和所述注意力矩阵，将所述音素序列向所述视频帧序列进行对齐，得到所述音素序列中音素与所述目标视频帧的对应关系。7.根据权利要求1所述的方法，其特征在于，所述根据所述视觉风格序列和用于配音的音素序列，确定所述待配音视频对应的音频特征序列，包括：通过对所述视觉风格序列和所述音素序列进行对齐，确定所述视觉风格序列中视觉风格特征与所述音素序列中音素间的对应关系；根据所述视觉风格特征确定所对应音素的声音韵律信息，所述声音韵律信息用于标识所对应音素的声音能量和音高；通过所述声音韵律信息和所述音素序列，生成所述待配音视频对应的音频特征序列。8.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取所述待配音视频中所述目标对象对应的音频文本信息；根据所述音频文本信息生成所述音素序列。9.根据权利要求1所述的方法，其特征在于，所述根据所述视频帧序列，对所述目标对象进行三维重建，得到所述视频帧序列中每个目标视频帧分别对应的三维目标对象，包括：根据所述视频帧序列，确定所述视频帧序列中每个目标视频帧分别对应的三维重建参数，所述三维重建参数包括身份特征参数，姿态特征参数和表情特征参数；根据所述三维重建参数，得到所述视频帧序列中每个目标视频帧分别对应的所述三维目标对象。10.根据权利要求1所述的方法，其特征在于，所述三维目标模型中去除了所对应目标视频帧中的目标对象的身份特征。11.一种配音装置，其特征在于，所述装置包括获取单元，三...

【专利技术属性】
技术研发人员：杨智涵，李旭，刘山松，单瀛，吴志勇，贾珈，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人