一种视频新闻分割方法和装置制造方法及图纸

技术编号:19438267 阅读:22 留言:0更新日期:2018-11-14 13:40
本申请提供了一种视频新闻分割方法,为基于新闻标题和静音点的视频新闻分割方法,对于一个镜头内存在多个新闻标题的镜头,该方法根据镜头内的标题和静音点将镜头细分为子镜头,从而实现镜头内部的视频片段的拆分,提高了视频新闻分割的性能。此外,本申请还提供了一种视频新闻分割装置。

【技术实现步骤摘要】
一种视频新闻分割方法和装置
本申请涉及互联网
,尤其涉及一种视频新闻分割方法和装置。
技术介绍
新闻视频中蕴含着大量的最新资讯信息,对于视频网站和新闻类的应用来说有着重要的价值。视频网站或者新闻类的应用需要对每日播出的整条新闻进行分割、上线,供用户对于其中感兴趣的每条新闻进行点击观看。由于全国的电视台数量众多,除卫视台外还存在各类地方台,如果需要对所有的新闻进行分割的话,需要耗费大量的人力进行切分。同时由于新闻的时效性,对于新闻视频的分割的速度要求也是十分严格的,所以给人工分割带来的更大的压力。新闻都是在某个时间(如中午12点)大量播出,为了保证时效性,需要在规定的时间内尽快将整个的新闻节目切割成独立新闻条目,而不能采用积压任务后期处理的方式进行生产。因此,一种视频新闻的自动分割技术就成为解决这一问题的关键。现有的视频新闻的自动分割技术一般是基于镜头进行的。也就是说,将镜头的起点或终点作为视频新闻的分割点,从而将视频新闻分割成多个不同的视频片段。然而,这种基于镜头进行的视频新闻的分割技术只能实现不同镜头的视频片段的拆分,而不能实现镜头内部的视频片段的拆分,如此,导致视频新闻分割的性能较差。
技术实现思路
有鉴于此,本申请实施例提供了一种视频新闻分割方法和装置,以实现镜头内部的视频片段的拆分,进而提高视频新闻分割的性能。为了解决上述技术问题,本申请实施例采用了如下技术方案:一种视频新闻分割方法,包括:对视频新闻进行镜头检测、新闻标题检测和静音点检测,以分别得到所述视频新闻的镜头序列、标题序列和静音点序列,所述镜头序列中的每个镜头标记为镜头对应的帧区间,所述标题序列中的每个标题标记为标题在所述视频新闻中持续出现的帧区间;所述静音点序列中的每个静音点标记为持续处于静音状态的帧区间;分别对所述镜头序列中的每个镜头与所述标题序列中的每个标题进行融合,以查找存在帧交叠的镜头与标题,当查找到存在帧交叠的镜头与标题时,将该标题添加到与其存在帧交叠的镜头的文本列表中;其中,预先设置有每一镜头的文本列表,并且设定任意一个镜头的文本列表的初始值为空;分别对所述镜头序列中的每个镜头与所述静音点序列中的每个静音点进行融合,以查找存在帧交叠的镜头与静音点,当查找到存在帧交叠的镜头与静音点时,将该静音点添加到与其存在帧交叠的镜头的静音列表中;其中,预先设置有每一镜头的静音列表,并且设定任意一个镜头的静音列表的初始值为空;依次判断每一镜头的文本列表中的标题数量n是否大于1,其中,n为整数;若特定镜头的文本列表中的标题数量n大于1,将该特定镜头的文本列表中的每相邻两个标题出现在视频新闻中之间的帧区间分别与所述静音点序列中的每个静音点进行融合,以筛选该特定镜头的内部分割点;根据该特定镜头内部的分割点对该特定镜头内的视频帧进行拆分。一种视频新闻分割装置,包括:镜头检测单元,用于对视频新闻进行镜头检测,以得到所述视频新闻的镜头序列,所述镜头序列中的每个镜头标记为镜头对应的帧区间;新闻标题检测单元,用于对视频新闻进行新闻标题检测,以得到所述视频新闻的标题序列,所述标题序列中的每个标题标记为标题在所述视频新闻中持续出现的帧区间;静音点检测单元,用于对视频新闻进行静音点检测,以得到所述视频新闻的静音点序列,所述静音点序列中的每个静音点标记为持续处于静音状态的帧区间;第一融合单元,用于分别对所述镜头序列中的每个镜头与所述标题序列中的每个标题进行融合,以查找存在帧交叠的镜头与标题;第一添加单元,用于当查找到存在帧交叠的镜头与标题时,将该标题添加到与其存在帧交叠的镜头的文本列表中;其中,预先设置有每一镜头的文本列表,并且设定任意一个镜头的文本列表的初始值为空;第二融合单元,用于分别对所述镜头序列中的每个镜头与所述静音点序列中的每个静音点进行融合,以查找存在帧交叠的镜头与静音点;第二添加单元,用于当查找到存在帧交叠的镜头与静音点时,将该静音点添加到与其存在帧交叠的镜头的静音列表中;其中,预先设置有每一镜头的静音列表,并且设定任意一个镜头的静音列表的初始值为空;判断单元,用于依次判断每一镜头的文本列表中的标题数量n是否大于1,其中,n为整数;第三融合单元,用于若特定镜头的文本列表中的标题数量n大于1,将该特定镜头的文本列表中的每相邻两个标题出现在视频新闻中之间的帧区间分别与所述静音点序列中的每个静音点进行融合,以筛选该特定镜头的内部分割点;拆分单元,用于根据该特定镜头内部的分割点对该特定镜头内的视频帧进行拆分。相较于现有技术,本申请具有以下有益效果:由于新闻标题是一个具有重要语义信息的标志,如果在一个镜头中出现两个不同标题的过渡,意味着这个镜头中出现了两个不同的语义的信息,应该将这个镜头拆分为两个不同的子镜头。而且有时新闻标题在视频中消失后,该新闻标题对应的新闻条目并没有结束播报,而在播报不同新闻条目之间会存在静音点,因此,本申请实施例提供的视频新闻分割方法根据镜头内的标题和静音点将镜头细分为子镜头,从而实现镜头内部的视频片段的拆分,提高了视频新闻分割的性能。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的视频新闻分割方法的流程图;图2为本申请实施例提供的视频新闻分割方法的一原理示意图;图3为本申请实施例提供的一个示例性的应用场景的示意图;图4为本申请实施例中S101的具体实现方式的流程图;图5为本申请实施例中S102的一种确定标题候选区的实现方式的流程图;图6为本申请实施例中S102的一种跟踪标题候选区的实现方式的流程图;图7为本申请实施例中S102的一种获取标题序列的实现方式的流程图;图8为本申请实施例中S103的具体实现方式的流程图;图9为本申请实施例中计算静音点帧长度的一种具体实现方式的流程图;图10为本申请实施例提供的一种视频新闻分割装置的结构示意图。具体实施方式基于
技术介绍
可知,现有的视频新闻的自动分割技术一般是基于镜头进行的,一般都会将视频帧序列先聚类为镜头序列。也就是说,现有的视频新闻的自动分割技术一般将镜头的起点或终点作为视频新闻的分割点,从而将视频新闻分割成多个不同的视频片段。然而,这种基于镜头进行的视频新闻的分割技术只能实现不同镜头的视频片段的拆分,而不能实现镜头内部的视频片段的拆分,如此有可能将不同的新闻条目分到一个视频片段内,例如,针对主持人总结上一条新闻内容,随后播报下一条新闻的情况的视频镜头会分到一个视频片段内,如此,导致分割后的单个视频片段内可能包含多条新闻条目的信息,如此,导致视频新闻分割的性能较差。由于新闻标题是一个具有重要语义信息的标志,如果在一个镜头中出现两个不同标题的过渡,意味着这个镜头中出现了两个不同的语义的信息,应该将这个镜头拆分为两个不同的子镜头。而且,有时新闻标题在视频中消失后,该新闻标题对应的新闻条目并没有结束播报,而在播报不同新闻条目之间会存在静音点。基于新闻标题的语义信息,结合视频新闻中的静音点,本申请实施例提供了一种视频新闻分割方法,该分割方本文档来自技高网
...

【技术保护点】
1.一种视频新闻分割方法,其特征在于,包括:对视频新闻进行镜头检测、新闻标题检测和静音点检测,以分别得到所述视频新闻的镜头序列、标题序列和静音点序列,所述镜头序列中的每个镜头标记为镜头对应的帧区间,所述标题序列中的每个标题标记为标题在所述视频新闻中持续出现的帧区间;所述静音点序列中的每个静音点标记为持续处于静音状态的帧区间;分别对所述镜头序列中的每个镜头与所述标题序列中的每个标题进行融合,以查找存在帧交叠的镜头与标题,当查找到存在帧交叠的镜头与标题时,将该标题添加到与其存在帧交叠的镜头的文本列表中;其中,预先设置有每一镜头的文本列表,并且设定任意一个镜头的文本列表的初始值为空;分别对所述镜头序列中的每个镜头与所述静音点序列中的每个静音点进行融合,以查找存在帧交叠的镜头与静音点,当查找到存在帧交叠的镜头与静音点时,将该静音点添加到与其存在帧交叠的镜头的静音列表中;其中,预先设置有每一镜头的静音列表,并且设定任意一个镜头的静音列表的初始值为空;依次判断每一镜头的文本列表中的标题数量n是否大于1,其中,n为整数;若特定镜头的文本列表中的标题数量n大于1,将该特定镜头的文本列表中的每相邻两个标题出现在视频新闻中之间的帧区间分别与所述静音点序列中的每个静音点进行融合,以筛选该特定镜头的内部分割点;根据该特定镜头内部的分割点对该特定镜头内的视频帧进行拆分。...

【技术特征摘要】
1.一种视频新闻分割方法,其特征在于,包括:对视频新闻进行镜头检测、新闻标题检测和静音点检测,以分别得到所述视频新闻的镜头序列、标题序列和静音点序列,所述镜头序列中的每个镜头标记为镜头对应的帧区间,所述标题序列中的每个标题标记为标题在所述视频新闻中持续出现的帧区间;所述静音点序列中的每个静音点标记为持续处于静音状态的帧区间;分别对所述镜头序列中的每个镜头与所述标题序列中的每个标题进行融合,以查找存在帧交叠的镜头与标题,当查找到存在帧交叠的镜头与标题时,将该标题添加到与其存在帧交叠的镜头的文本列表中;其中,预先设置有每一镜头的文本列表,并且设定任意一个镜头的文本列表的初始值为空;分别对所述镜头序列中的每个镜头与所述静音点序列中的每个静音点进行融合,以查找存在帧交叠的镜头与静音点,当查找到存在帧交叠的镜头与静音点时,将该静音点添加到与其存在帧交叠的镜头的静音列表中;其中,预先设置有每一镜头的静音列表,并且设定任意一个镜头的静音列表的初始值为空;依次判断每一镜头的文本列表中的标题数量n是否大于1,其中,n为整数;若特定镜头的文本列表中的标题数量n大于1,将该特定镜头的文本列表中的每相邻两个标题出现在视频新闻中之间的帧区间分别与所述静音点序列中的每个静音点进行融合,以筛选该特定镜头的内部分割点;根据该特定镜头内部的分割点对该特定镜头内的视频帧进行拆分。2.根据权利要求1所述的方法,其特征在于,所述将该特定镜头的文本列表中的每相邻两个标题出现在视频新闻中之间的帧区间分别与所述静音点序列中的每个静音点进行融合,以筛选该特定镜头的内部分割点,具体包括:从所述文本列表中的每相邻两个标题出现在视频新闻中之间的帧区间内查找该特定镜头中的静音点;若该特定镜头中存在静音点,则计算每个静音点的帧长度;将帧长度最长的静音点位置作为该特定镜头内部的分割点;若该特定镜头中不存在静音点,则将所述每相邻两个标题中的前一标题在视频中的结束帧的下一帧作为该特定镜头内部的分割点。3.根据权利要求2所述的方法,其特征在于,设定每相邻两个标题为第I标题和第II标题,所述计算静音点的帧长度,具体包括:判断该特定镜头中的静音点的结束帧对应的时间是否大于第II标题在视频新闻中出现的起始帧对应的时间,如果是,将该第II标题在视频新闻中出现的起始帧确定为该特定镜头中的静音点的结束帧,如果否,则将静音点结束帧确定为该特定镜头中的静音点的结束帧;判断该特定镜头中的静音点起始帧对应的时间是否小于第I标题在视频新闻中出现的结束帧对应的时间,如果是,将第I标题在视频新闻中出现的结束帧确定为该特定镜头中的静音点起始帧,如果否,则将静音点起始帧确定为该特定镜头中的静音点的起始帧;将所述静音点结束帧对应的时间与所述静音点起始帧对应的时间相减,得到的结果为静音点的帧长度。4.根据权利要求2所述的方法,其特征在于,所述将帧长度最长的静音点位置作为该特定镜头内部的分割点,具体包括:将所述帧长度最长的静音点对应的中点作为该特定镜头内部的分割点。5.根据权利要求1所述的方法,其特征在于,所述对所述镜头序列中的每个镜头与所述标题序列中的每个标题进行融合,以查找存在帧交叠的镜头与标题,具体包括:以所述标题序列中的每个标题为单位,扫描所述镜头序列中的所有镜头,以查找与每个标题存在帧交叠的镜头。6.根据权利要求1所述的方法,其特征在于,所述对所述镜头序列中的每个...

【专利技术属性】
技术研发人员:刘楠
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1