【技术实现步骤摘要】
用于生成信息的方法和装置
本申请实施例涉及计算机
,具体涉及用于生成信息的方法和装置。
技术介绍
随着网络技术的发展,世界各地的各类新闻可以通过各种媒体发布给用户。对于同一个新闻事件,各种媒体(例如新闻类网站或者新闻类应用)会编辑出不同的新闻,不同媒体发出的新闻的侧重点会存在一定的差异,但是报道同一新闻事件的各个新闻中也会存在或多或少的重合信息。对于用户来说,可能需要阅读多篇新闻报道才能从中提取出自己想要的信息,这就会导致用户的获取新闻的效率较低。为了帮助用户提高新闻获取的效率,可以对同一新闻事件的多篇新闻进行聚合,去除多篇新闻中的冗余信息,提取针对新闻事件的解说词。
技术实现思路
本申请实施例提出了用于生成信息的方法和装置。第一方面,本申请实施例提供了一种用于生成信息的方法,该方法包括:将对目标新闻簇所包括的各个视频进行语义分割所得到的至少一个视频片段确定为目标视频集合,其中,目标新闻簇内的各个新闻针对同一新闻事件;确定目标新闻簇的解说词;基于目标视频集合和目标图像集合,确定与解说 ...
【技术保护点】
1.一种用于生成信息的方法,包括:/n将对目标新闻簇所包括的各个视频进行语义分割所得到的至少一个视频片段确定为目标视频集合,其中,所述目标新闻簇内的各个新闻针对同一新闻事件;/n确定所述目标新闻簇的解说词;/n基于所述目标视频集合和目标图像集合,确定与所述解说词对应的候选素材资源集合,其中,所述目标图像集合由所述目标新闻簇所包括的各个图像组成;/n对于所述解说词中的每个段落,确定该段落与所述候选素材资源集合中每个候选素材资源的匹配度。/n
【技术特征摘要】
1.一种用于生成信息的方法,包括:
将对目标新闻簇所包括的各个视频进行语义分割所得到的至少一个视频片段确定为目标视频集合,其中,所述目标新闻簇内的各个新闻针对同一新闻事件;
确定所述目标新闻簇的解说词;
基于所述目标视频集合和目标图像集合,确定与所述解说词对应的候选素材资源集合,其中,所述目标图像集合由所述目标新闻簇所包括的各个图像组成;
对于所述解说词中的每个段落,确定该段落与所述候选素材资源集合中每个候选素材资源的匹配度。
2.根据权利要求1所述的方法,其中,所述方法还包括:
基于所述解说词中各段落与各所述候选素材资源之间的匹配度、各所述候选素材资源的播放时长以及所述解说词中各段落的文本长度,确定与所述解说词中的每个段落对应的候选素材资源序列;
基于所述解说词中的每个段落对应的候选素材资源序列,生成与所述解说词对应的视频。
3.根据权利要求2所述的方法,其中,所述方法还包括:
将与所述解说词对应的视频发送给终端设备,以供所述终端设备呈现所收到的视频。
4.根据权利要求3所述的方法,其中,所述基于所述解说词中的每个段落对应的候选素材资源序列,生成与所述解说词对应的视频,包括:
对于所述解说词中的每个段落,利用语音合成技术生成与该段落对应的语音;
基于所述解说词中的每个段落对应的语音和候选素材资源序列,生成与所述解说词对应的视频。
5.根据权利要求4所述的方法,其中,所述基于所述目标视频集合和目标图像集合,确定与所述解说词对应的候选素材资源集合,包括:
合并所述目标视频集合和所述目标图像集合得到与所述解说词对应的候选素材资源集合。
6.根据权利要求4所述的方法,其中,所述基于所述目标视频集合和目标图像集合,确定与所述解说词对应的候选素材资源集合,包括:
对于所述目标视频集合中的每个目标视频,将该目标视频输入预先训练的生动视频检测模型,得到与该目标视频对应的生动视频检测结果,其中,所述生动视频检测模型用于表征视频和用于表征是否是生动视频的生动视频检测结果之间的对应关系;
将所述目标视频集合中对应的生动视频检测结果用于表征非生动视频的目标视频删除;
合并所述目标视频集合和所述目标图像集合得到与所述解说词对应的候选素材资源集合。
7.根据权利要求6所述的方法,其中,在将所述目标视频集合中对应的生动视频检测结果用于表征非生动视频的目标视频删除之后,所述方法还包括:
将所述目标视频集合中视频播放时长小于预设最短候选视频时长的视频删除。
8.根据权利要求4所述的方法,其中,所述对于所述解说词中的每个段落,确定该段落与所述候选素材资源集合中每个候选素材资源的匹配度,包括:
对于所述解说词中的每个段落,确定与该段落对应的语义向量;
对于所述候选素材资源集合中的每个候选素材资源,确定与该候选素材资源对应的语义向量;
将所述解说词中的每个段落对应的语义向量与所述候选素材资源集合中每个候选素材资源对应的语义向量之间的相似度,确定为相应段落与相应候选素材资源之间的匹配度。
9.根据权利要求8所述的方法,其中,所述对于所述候选素材资源集合中的每个候选素材资源,确定与该候选素材资源对应的语义向量,包括:
响应于确定该候选素材资源为图像,对该图像候选素材资源进行语义分割,得到该图像候选素材资源对应的至少一个语义标注结果,以及根据所得到的至少一个语义标注结果中每个语义标注结果对应的语义向量确定与该候选素材资源对应的语义向量;
响应于确定该候选素材资源为视频,对该视频候选素材资源进行下采样,得到至少一个样本图像;
对于所述至少一个样本图像中的每个样本图像,对该样本图像进行语义分割,得到该样本图像对应的至少一个语义标注结果,以及根据所得到的至少一个语义标注结果中每个语义标注结果对应的语义向量确定与该样本图像对应的语义向量;
根据各所述样本图像对应的语义向量,确定与该候选素材资源对应的语义向量。
10.根据权利要求9所述的方法,其中,所述根据各所述样本图像对应的语义向量,确定与该候选素材资源对应的语义向量,包括:
将各所述样本图像对应的语义向量的均值向量确定为与该候选素材资源对应的语义向量。
11.根据权利要求10所述的方法,其中,所述根据各所述样本图像对应的语义向量,确定与该候选素材资源对应的语义向量,包括:
将由各所述样本图像对应的语义向量的各维取值的中间值所对应的向量确定为与该候选素材资源对应的语义向量。
12.一种用于生成信息的装置,包括:
语义分割单元,被配置成将对目标新闻簇所包括的各个视频进行语义分割所得到的至少一个视频片段确定为目标视频集合,其中,所述目标新闻簇内的各个新闻针对同一新闻事件;
解说词确定单元,被配置成确定所述目...
【专利技术属性】
技术研发人员:田浩,陈曦,王健宇,卢大明,
申请(专利权)人:百度时代网络技术北京有限公司,百度美国有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。