视频生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号：37173669 阅读：24 留言：0更新日期：2023-04-20 22:43

本公开实施例提供一种视频生成方法、装置、电子设备及存储介质，该方法通过获取原始视频，并基于原始视频中的视频内容，切分原始视频，得到至少两个视频片段；生成视频片段对应的解说语音，解说语音用于描述视频片段的画面内容；根据视频片段和对应的解说语音，生成目标视频。由于在获得原始视频后，首先根据视频内容将原始视频切分为多个视频片段，再基于视频片段进行解析，生成对应的解说语音，进而对视频片段和解说语音进行合成，得到目标视频，实现了从原始视频到目标视频的自动生成，并保证目标视频中的解说语音的合理性和准确性，提高视频生成效率、降低制作成本。降低制作成本。降低制作成本。

全部详细技术资料下载

【技术实现步骤摘要】
视频生成方法、装置、电子设备及存储介质

[0001]本公开实施例涉及图像处理
，尤其涉及一种视频生成方法、装置、电子设备及存储介质。

技术介绍

[0002]无障碍视频，是指为视力障碍人群提供的视频。由于视力障碍人群无法正常观看视频中的图像内容，因此，现有技术中通过在视频中增设大量的解说语音，制作成针对视力障碍人群的目标视频，从而帮助视力障碍人群能够“听懂”视频，该技术在其他相关场景下也有广泛应用。
[0003]现有技术中，此类视频的制作流程复杂，通常需要人工录制视频中的解说配音，导致了视频生成效率低下、制作成本高等问题。

技术实现思路

[0004]本公开实施例提供一种视频生成方法、装置、电子设备及存储介质，以克服视频生成效率低下、制作成本高等问题。
[0005]第一方面，本公开实施例提供一种视频生成方法，包括：
[0006]获取原始视频，并基于所述原始视频中的视频内容，切分所述原始视频，得到至少两个视频片段；生成所述视频片段对应的解说语音，所述解说语音用于描述所述视频片段的画面内...

【技术保护点】

【技术特征摘要】
1.一种视频生成方法，其特征在于，包括：获取原始视频，并基于所述原始视频中的视频内容，切分所述原始视频，得到至少两个视频片段；生成所述视频片段对应的解说语音，所述解说语音用于描述所述视频片段的画面内容；根据所述视频片段和对应的解说语音，生成目标视频。2.根据权利要求1所述的方法，其特征在于，所述生成所述视频片段对应的解说语音，包括：对所述视频片段的进行内容识别，得到表征所述视频片段的画面内容的内容信息；根据所述内容信息生成对应的解说文本；根据所述解说文本，生成所述解说语音。3.根据权利要求2所述的方法，其特征在于，所述根据所述解说文本，生成所述解说语音，包括：根据所述视频片段的内容信息，确定所述解说语音的目标语速；基于所述目标语速，生成所述解说语音。4.根据权利要求2所述的方法，其特征在于，所述方法还包括：获取所述视频片段的视频语音，并提取所述视频语音的第一语义特征；获取所述内容信息的第二语义特征，并对比所述第二语义特征与所述第一语义特征的特征相似度；根据所述内容信息生成对应的解说文本，包括：若所述特征相似度小于相似度阈值，则根据所述第二语义特征，生成所述解说文本。5.根据权利要求2所述的方法，其特征在于，所述内容信息中至少包括第一信息和第二信息，其中，所述第一信息表征所述视频片段中的目标人物，所述第二信息表征所述目标人物对应的目标动作；根据所述内容信息生成对应的解说文本，包括：根据所述第一信息和所述第二信息，生成至少一组子文本，所述子文本用于表征对应的播放时刻下，所述视频片段中的目标人物和对应的目标动作；根据各所述子文本和对应的播放时刻，生成所述解说文本。6.根据权利要求...

【专利技术属性】
技术研发人员：辜心，陈光，王欣尧，袁野，王宇飞，文珑银，胡子建，
申请(专利权)人：脸萌有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人