视频生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37173669 阅读:24 留言:0更新日期:2023-04-20 22:43
本公开实施例提供一种视频生成方法、装置、电子设备及存储介质,该方法通过获取原始视频,并基于原始视频中的视频内容,切分原始视频,得到至少两个视频片段;生成视频片段对应的解说语音,解说语音用于描述视频片段的画面内容;根据视频片段和对应的解说语音,生成目标视频。由于在获得原始视频后,首先根据视频内容将原始视频切分为多个视频片段,再基于视频片段进行解析,生成对应的解说语音,进而对视频片段和解说语音进行合成,得到目标视频,实现了从原始视频到目标视频的自动生成,并保证目标视频中的解说语音的合理性和准确性,提高视频生成效率、降低制作成本。降低制作成本。降低制作成本。

【技术实现步骤摘要】
视频生成方法、装置、电子设备及存储介质


[0001]本公开实施例涉及图像处理
,尤其涉及一种视频生成方法、装置、电子设备及存储介质。

技术介绍

[0002]无障碍视频,是指为视力障碍人群提供的视频。由于视力障碍人群无法正常观看视频中的图像内容,因此,现有技术中通过在视频中增设大量的解说语音,制作成针对视力障碍人群的目标视频,从而帮助视力障碍人群能够“听懂”视频,该技术在其他相关场景下也有广泛应用。
[0003]现有技术中,此类视频的制作流程复杂,通常需要人工录制视频中的解说配音,导致了视频生成效率低下、制作成本高等问题。

技术实现思路

[0004]本公开实施例提供一种视频生成方法、装置、电子设备及存储介质,以克服视频生成效率低下、制作成本高等问题。
[0005]第一方面,本公开实施例提供一种视频生成方法,包括:
[0006]获取原始视频,并基于所述原始视频中的视频内容,切分所述原始视频,得到至少两个视频片段;生成所述视频片段对应的解说语音,所述解说语音用于描述所述视频片段的画面内容;根据所述视频片段本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种视频生成方法,其特征在于,包括:获取原始视频,并基于所述原始视频中的视频内容,切分所述原始视频,得到至少两个视频片段;生成所述视频片段对应的解说语音,所述解说语音用于描述所述视频片段的画面内容;根据所述视频片段和对应的解说语音,生成目标视频。2.根据权利要求1所述的方法,其特征在于,所述生成所述视频片段对应的解说语音,包括:对所述视频片段的进行内容识别,得到表征所述视频片段的画面内容的内容信息;根据所述内容信息生成对应的解说文本;根据所述解说文本,生成所述解说语音。3.根据权利要求2所述的方法,其特征在于,所述根据所述解说文本,生成所述解说语音,包括:根据所述视频片段的内容信息,确定所述解说语音的目标语速;基于所述目标语速,生成所述解说语音。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:获取所述视频片段的视频语音,并提取所述视频语音的第一语义特征;获取所述内容信息的第二语义特征,并对比所述第二语义特征与所述第一语义特征的特征相似度;根据所述内容信息生成对应的解说文本,包括:若所述特征相似度小于相似度阈值,则根据所述第二语义特征,生成所述解说文本。5.根据权利要求2所述的方法,其特征在于,所述内容信息中至少包括第一信息和第二信息,其中,所述第一信息表征所述视频片段中的目标人物,所述第二信息表征所述目标人物对应的目标动作;根据所述内容信息生成对应的解说文本,包括:根据所述第一信息和所述第二信息,生成至少一组子文本,所述子文本用于表征对应的播放时刻下,所述视频片段中的目标人物和对应的目标动作;根据各所述子文本和对应的播放时刻,生成所述解说文本。6.根据权利要求...

【专利技术属性】
技术研发人员:辜心陈光王欣尧袁野王宇飞文珑银胡子建
申请(专利权)人:脸萌有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1