用于生成视频的方法和装置制造方法及图纸

技术编号:33926712 阅读:38 留言:0更新日期:2022-06-25 21:50
本申请实施例公开了用于生成视频的方法和装置。该方法的一具体实施方式包括:确定目标新闻簇的解说词,其中,目标新闻簇中的各个新闻针对同一个新闻事件;生成与所述解说词中的每个段落对应的语音;基于所述目标新闻簇包括的视频和图像,确定与所述解说词对应的候选素材资源集合,其中,候选素材资源为视频或图像;确定与所述解说词中的每个段落对应的候选素材资源序列;以及按照所述解说词中各段落从前到后的顺序,将与各段落对应的语音和视频分别连接起来得到第一音频和第一视频,分别作为与所述解说词对应的视频中的音频和视频部分,其中,段落对应的视频是顺序连接该段落对应的候选素材资源序列中的候选素材资源得到的视频。频。频。

【技术实现步骤摘要】
用于生成视频的方法和装置


[0001]本申请实施例涉及计算机
,具体涉及用于生成视频的方法和装置。

技术介绍

[0002]随着网络技术的发展,世界各地的各类新闻可以通过各种媒体发布给用户。对于同一个新闻事件,各种媒体(例如新闻类网站或者新闻类应用)会编辑出不同的新闻,不同媒体发出的新闻的侧重点会存在一定的差异,但是报道同一新闻事件的各个新闻中也会存在或多或少的重合信息。
[0003]对于用户来说,可能需要阅读多篇新闻报道才能从中提取出自己想要的信息,这就会导致用户的获取新闻的效率较低。为了帮助用户提高新闻获取的效率,可以对同一新闻事件的多篇新闻进行聚合,去除多篇新闻中的冗余信息,提取针对新闻事件的解说词。

技术实现思路

[0004]本申请实施例提出了用于生成视频的方法和装置。
[0005]第一方面,本申请实施例提供了一种用于生成视频的方法,该方法包括:确定目标新闻簇的解说词,其中,目标新闻簇中的各个新闻针对同一个新闻事件;利用语音合成技术,生成与解说词中的每个段落对应的语音;基于目标新闻簇包括的视频和图像,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于生成视频的方法,包括:确定目标新闻簇的解说词,其中,目标新闻簇中的各个新闻针对同一个新闻事件;生成与所述解说词中的每个段落对应的语音;基于所述目标新闻簇包括的视频和图像,确定与所述解说词对应的候选素材资源集合,其中,候选素材资源为视频或图像;确定与所述解说词中的每个段落对应的候选素材资源序列;以及按照所述解说词中各段落从前到后的顺序,将与各段落对应的语音和视频分别连接起来得到第一音频和第一视频,分别作为与所述解说词对应的视频中的音频和视频部分,其中,段落对应的视频是顺序连接该段落对应的候选素材资源序列中的候选素材资源得到的视频。2.根据权利要求1所述的方法,其中,在确定目标新闻簇的解说词之前,所述方法还包括:确定目标新闻簇。3.根据权利要求2所述的方法,其中,所述确定目标新闻簇,包括:获取最近第一预设时长内所生成的新闻组成的至少一个新闻簇;基于所述至少一个新闻簇确定所述目标新闻簇。4.根据权利要求3所述的方法,其中,所述基于所述至少一个新闻簇确定所述目标新闻簇,包括:将所述至少一个新闻簇中的每个新闻簇确定为所述目标新闻簇。5.根据权利要求3所述的方法,其中,所述基于所述至少一个新闻簇确定所述目标新闻簇,包括:将所述至少一个新闻簇中的每个新闻簇按照该新闻簇内最近第二预设时长内所生成的新闻数目从多到少的顺序进行排序;将所述至少一个新闻簇中排序在预设排序范围内的每个新闻簇确定为所述目标新闻簇。6.根据权利要求3所述的方法,其中,所述基于所述至少一个新闻簇确定所述目标新闻簇,包括:将所述至少一个新闻簇中的每个优质新闻簇确定为所述目标新闻簇,其中,优质新闻簇所包括的新闻中所包括的图像数目大于预设最少图像数目以及所包括的视频数目大于预设最少视频数目。7.根据权利要求3所述的方法,其中,所述基于所述至少一个新闻簇确定所述目标新闻簇,包括:对于所述至少一个新闻簇中的每个新闻簇,基于该新闻簇中的各个新闻确定该新闻簇对应的新闻事件主题以及所确定的新闻事件主题的当前出现频度;确定所述至少一个新闻簇中每个新闻簇对应的新闻事件主题的当前出现频度减去该新闻事件主题的历史出现频度的频度差值;将所述至少一个新闻簇中对应的新闻事件主题的频度差值大于预设频度差值阈值的新闻簇确定为所述目标新闻簇。8.根据权利要求1所述的方法,其中,所述确定目标新闻簇的解说词,包括:
对于所述目标新闻簇中的每个新闻,确定该新闻的适合生成解说词的得分;将所述目标新闻簇中适合生成解说词的得分最高的新闻确定为目标新闻;将所述目标新闻中所包括的文本确定为目标文本;删除所述目标文本中所包括的不适合解说文本,其中,不适合解说文本为预先确定的不适合解说文本集合中的文本;将所述目标文本中所包括的书面语替换为相同语义的口语;将对所述目标文本提取摘要所得到的摘要文本确定为所述目标新闻簇的解说词。9.根据权利要求8所述的方法,其中,所述将对所述目标文本提取摘要所得到的摘要文本确定为所述目标新闻簇的解说词,包括:按照预设最快语速和预设最长音频时长确定解说词最多字数;对所述目标文本进行摘要提取,且所提取的摘要文本的字数少于所述解说词最多字数;将所提取的摘要文本确定为所述目标新闻簇的解说词。10.根据权利要求8所述的方法,其中,所述对于所述目标新闻簇中的每个新闻,确定该新闻的适合生成解说词的得分,包括:提取该新闻在至少一种特征下的特征值;基于所提取的至少一种特征值,确定该新闻的适合生成解说词的得分。11.根据权利要求8所述的方法,其中,所述对于所述目标新闻簇中的每个新闻,确定该新闻的适合生成解说词的得分,包括:将该新闻所包括的文本输入预先训练的得分计算模型,得到该新闻的适合生成解说词的得分,其中,所述得分计算模型用于表征文本和文本适合生成解说词的得分之间的对应关系。12.根据权利要求1所述的方法,其中,所述基于所述目标新闻簇包括的视频和图像,确定与所述解说词对应的候选素材资源集合,包括:将所述目标新闻簇所包括的视频和图像确定为与所述解说词对应的候选素材资源集合。13.根据权利要求1所述的方法,其中,所述基于所述目标新闻簇包括的视频和图像,确定与所述解说词对应的候选素材资源集合,包括:将对所述目标新闻簇所包括的各个视频进行语义分割所得到的至少一个视频片段确定为目标视频集合;将所述目标新闻簇所包括的各个图像确定为目标图像集合;基于所述目标视频集合和所述目标图像集合,确定与所述解说词对应的候选素材资源集合,候选素材资源为视频或图像。14.根据权利要求13所述的方法,其中,所述基于所述目标视频集合和所述目标图像集合,确定与所述解说词对应的候选素材资源集合,包括:合并所述目标视频集合和所述目标图像集合得到与所述解说词对应的候选素材资源集合。15.根据权利要求13所述的方法,其中,所述基于所述目标视频集合和所述目标图像集合,确定与所述解说词对应的候选素材资源集合,包括:
对于所述目标视频集合中的每个目标视频,将该目标视频输入预先训练的生动视频检测模型,得到与该目标视频对应的生动视频检测结果,其中,所述生动视频检测模型用于表征视频和用于表征是否是生动视频的生动视频检测结果之间的对应关系;将所述目标视频集合中对应的生动视频检测结果用于表征非生动视频的目标视频删除;合并所述目标视频集合和所述目标图像集合得到与所述解说词对应的候选素材资源集合。16.根据权利要求15所述的方法,其中,在将所述目标视频集合中对应的生动视频检测结果用于表征非生动视频的目标视频删除之后,所述方法还包括:将所述目标视频集合中视频播放时长小于预设最短候选视频时长的视频删除。17.根据权利要求1所述的方法,其中,所述确定与所述解说词中的每个段落对应的候选素材资源序列,包括:对于所述解说词中的每个段落,确定该段落与所述候选素材资源集合中每个候选素材资源的匹配度;基于所述解说词中各段落与各所述候选素材资源之间的匹配度、各所述候选素材资源的播放时长以及所述解说词中各段落的文本长度,确定与所述解说词中的每个段落对应的候选素材资源序列,其中,所述候选素材资源集合中的图像在与所述解说词对应的视频中的播放时长为预设图像播放时长。18.根据权利要求17所述的方法,其中,所述对于所述解说词中的每个段落,确定该段落与所述候选素材资源集合中每个候选素材资源的匹配度,包括:对于所述解说词中的每个段落,确定与该段落对应的语义向量;对于所述候选素材资源集合中的每个候选素材资源,确定与该候选素材资源...

【专利技术属性】
技术研发人员:田浩卢大明陈曦王健宇
申请(专利权)人:百度时代网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1