【技术实现步骤摘要】
新闻视频的摘要生成方法及装置
[0001]本公开涉及计算机
,尤其涉及知识图谱、深度学习、计算机视觉、语音
技术介绍
[0002]现在的媒体行业会对海量的新闻视频节目进行编目,以便于检索和管理,而新闻节目的摘要的生成是新闻节目编目中很重要的一个环节。
[0003]相关技术中,新闻节目视频的摘要生成基本都是基于自动语音识别技术(Automatic Speech Recognition,ASR)直接对新闻节目视频进行识别得到的,或者基于改进ASR的方式进行识别得到的。
技术实现思路
[0004]本公开提供了一种新闻视频的摘要生成方法、装置、设备以及存储介质。
[0005]根据本公开的第一方面,提供了一种新闻视频的摘要生成方法,包括:
[0006]获取新闻文本库和待生成摘要的新闻视频;
[0007]对所述新闻视频识别标题得到原始标题和/或对所述新闻视频提取摘要得到所述新闻视频的原始摘要;
[0008]根据所述原始标题和/或原始摘要,在所述新闻文本库中检索得到至 ...
【技术保护点】
【技术特征摘要】
1.一种新闻视频的摘要生成方法,包括:获取新闻文本库和待生成摘要的新闻视频;对所述新闻视频识别标题得到原始标题和/或对所述新闻视频提取摘要得到原始摘要;根据所述原始标题和/或原始摘要,在所述新闻文本库中检索得到至少一篇候选新闻文本;根据所述原始摘要和/或所述原始标题与所述至少一篇候选新闻文本的相似度,从所述至少一篇候选新闻文本中确定目标新闻;根据所述目标新闻,生成所述新闻视频的摘要。2.根据权利要求1所述的方法,其中,所述对所述新闻视频提取摘要得到原始摘要包括:通过OCR文字识别和ASR自动语音识别中的至少一种,对所述新闻视频进行特征提取;根据提取到的所述特征,提取出所述新闻视频的原始摘要。3.根据权利要求1所述的方法,其中,所述对所述新闻视频识别标题得到原始标题,包括:基于所述特征和所述新闻视频的元数据,抽取出所述新闻视频的原始标题。4.根据权利要求1
‑
3任一项所述的方法,所述根据所述原始摘要和/或所述原始标题与所述至少一篇候选新闻的相似度,从所述至少一篇候选新闻中确定目标新闻,包括:获取所述至少一篇候选新闻的正文的摘要;分别计算每一篇所述候选新闻的正文的摘要与所述原始摘要的第一相似度;响应于存在所述第一相似度超过第一预设阈值的候选新闻,将所述第一相似度超过第一预设阈值的候选新闻确定为所述目标新闻。5.根据权利要求4所述的方法,所述根据所述原始摘要和/或所述原始标题与所述至少一篇候选新闻的相似度,从所述至少一篇候选新闻中确定目标新闻,还包括:响应于不存在所述第一相似度超过所述第一预设阈值的候选新闻,获取所述至少一篇候选新闻的标题;分别计算每一篇所述候选新闻的标题与所述原始标题的第二相似度;响应于存在所述第二相似度超过第二预设阈值的候选新闻,将所述第二相似度超过所述第二预设阈值的候选新闻确定为所述目标新闻。6.根据权利要求1所述的方法,所述根据所述目标新闻,生成所述新闻视频的文本摘要,包括:提取所述目标新闻的正文的摘要;将所述目标新闻的正文的摘要作为所述新闻视频的文本摘要。7.一种新闻视频的摘要生成装置,包括:获取模块,用于获取新闻文本库和待生成摘要的新闻视频;特征提取模块,用于对所述新闻视频识别标题得到原始标题和/或对所述新闻视频提取摘要得到原始摘要;检索模块,用于根据所述原始标题和/或原始摘要,在所述新闻文本库中检索得到至少一篇候选新闻文本;
筛选模块,用于根据所述原始摘要和/或所述原始标题与...
【专利技术属性】
技术研发人员:张记袁,郑烨翰,蔡远俊,彭卫华,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。