【技术实现步骤摘要】
视频生成方法、装置、电子设备及存储介质
[0001]本公开实施例涉及图像处理
,尤其涉及一种视频生成方法、装置、电子设备及存储介质。
技术介绍
[0002]无障碍视频,是指为视力障碍人群提供的视频。由于视力障碍人群无法正常观看视频中的图像内容,因此,现有技术中通过在视频中增设大量的解说语音,制作成针对视力障碍人群的目标视频,从而帮助视力障碍人群能够“听懂”视频,该技术在其他相关场景下也有广泛应用。
[0003]现有技术中,此类视频的制作流程复杂,通常需要人工录制视频中的解说配音,导致了视频生成效率低下、制作成本高等问题。
技术实现思路
[0004]本公开实施例提供一种视频生成方法、装置、电子设备及存储介质,以克服视频生成效率低下、制作成本高等问题。
[0005]第一方面,本公开实施例提供一种视频生成方法,包括:
[0006]获取原始视频,并基于所述原始视频中的视频内容,切分所述原始视频,得到至少两个视频片段;生成所述视频片段对应的解说语音,所述解说语音用于描述所述视频片段的画面内 ...
【技术保护点】
【技术特征摘要】
1.一种视频生成方法,其特征在于,包括:获取原始视频,并基于所述原始视频中的视频内容,切分所述原始视频,得到至少两个视频片段;生成所述视频片段对应的解说语音,所述解说语音用于描述所述视频片段的画面内容;根据所述视频片段和对应的解说语音,生成目标视频。2.根据权利要求1所述的方法,其特征在于,所述生成所述视频片段对应的解说语音,包括:对所述视频片段的进行内容识别,得到表征所述视频片段的画面内容的内容信息;根据所述内容信息生成对应的解说文本;根据所述解说文本,生成所述解说语音。3.根据权利要求2所述的方法,其特征在于,所述根据所述解说文本,生成所述解说语音,包括:根据所述视频片段的内容信息,确定所述解说语音的目标语速;基于所述目标语速,生成所述解说语音。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:获取所述视频片段的视频语音,并提取所述视频语音的第一语义特征;获取所述内容信息的第二语义特征,并对比所述第二语义特征与所述第一语义特征的特征相似度;根据所述内容信息生成对应的解说文本,包括:若所述特征相似度小于相似度阈值,则根据所述第二语义特征,生成所述解说文本。5.根据权利要求2所述的方法,其特征在于,所述内容信息中至少包括第一信息和第二信息,其中,所述第一信息表征所述视频片段中的目标人物,所述第二信息表征所述目标人物对应的目标动作;根据所述内容信息生成对应的解说文本,包括:根据所述第一信息和所述第二信息,生成至少一组子文本,所述子文本用于表征对应的播放时刻下,所述视频片段中的目标人物和对应的目标动作;根据各所述子文本和对应的播放时刻,生成所述解说文本。6.根据权利要求...
【专利技术属性】
技术研发人员:辜心,陈光,王欣尧,袁野,王宇飞,文珑银,胡子建,
申请(专利权)人:脸萌有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。