分析视频文件的方法和装置制造方法及图纸

技术编号:9159843 阅读:233 留言:0更新日期:2013-09-14 12:05
本发明专利技术公开了一种分析视频文件的方法和装置。该方法包括:获取视频文件的音频数据和视频数据;根据该音频数据,确定该视频文件的至少一个静音点;根据该视频数据获取该视频文件的判断片段,该判断片段包括该视频文件的主持人镜头片段、标题片段和字幕片段中的至少一种片段;根据该判断片段,在该至少一个静音点中确定该视频文件的事件分割点。本发明专利技术实施例的分析视频文件的方法和装置,通过获取视频文件的至少一个静音点和判断片段,并根据该判断片段在该至少一个静音点中确定该视频文件的事件分割点,能够准确地确定事件分割点,从而能够准确地对视频文件进行事件分割,并由此能够提高视频编目的效率和准确性。

【技术实现步骤摘要】
【国外来华专利技术】分析视频文件的方法和装置
本专利技术涉及信息
,尤其涉及信息
中分析视频文件的方法和装置。
技术介绍
随着网络技术和信息技术的快速发展,大量的信息和资讯涌入我们的视线。图像、音频、视频等采用多媒体数据的表达方式,使得新闻的点击率得到了大幅的提高。多媒体数据正逐渐取代文字,成为新闻的主要载体。面对海量的新闻视频,人们感到了“信息过载”的压力。于是,人们开始关注如何从海量的视频数据中找到自己感兴趣的信息。这种需求促使了信息检索、个性化推荐以及数据挖掘等技术的发展。电视新闻节目是新闻视频的主要来源之一。新闻视频的分析和应用越来越引起业内的关注。目前新闻视频分析的主要内容包括:新闻拆条、新闻搜索、新闻推荐、潜在热点事件发现、新闻事件跟踪和舆情监控。在新闻视频分析的第一步即新闻拆条中,生成的新闻视频的语义信息可以作为拆条得到的新闻事件的元数据,以便于后续的新闻搜索、新闻事件跟踪等过程的分析与应用。新闻拆条针对的新闻视频集中了多个类型的新闻事件的视频,比如新闻联播和各地区的电视新闻节目。这种不同类型、不同事件组合在一起的新闻方式不适合信息的快速检索。因此,将新闻视频按不同事件划分成多个新闻视频片段的需求变得非常迫切。将新闻视频按不同事件进行划分俗称为“新闻拆条”或“碎片化”,即利用新闻视频的音频和视频特征,将新闻视频按不同事件进行分割。目前常用的音频和视频特征包括主持人镜头片段(也称为“口播帧”)、字幕片段、镜头切换片段和静音片段。目前,通过主持人镜头检测、字幕检测、静音检测和镜头切换检测等方法能够得到大量的分割时间点,但这些分割时间点与新闻事件分割点不是一对一的关系,更具体地说,这些分割时间点相对于新闻事件分割点来说是一种“过分割”,即新闻事件分割点集是前述分割时间点的一个子集。通常而言,主持人在播报新闻时,在叙述两个新闻事件时停顿的时间相比讲述同一个新闻事件中间停顿的时间略长。由此,业内通常检测新闻视频的静音片段,将静音片段的中间点作为静音点,并由此将该静音点确定为新闻事件分割点。但由于该方法中的静音点和事件分割点并没有必然联系,因此该方法不能准确地获取事件分割点。
技术实现思路
本专利技术实施例提供了一种分析视频文件的方法和装置,能够准确地确定事件分割点。一方面,本专利技术实施例提供了一种分析视频文件的方法,该方法包括:获取视频文件的音频数据和视频数据;根据该音频数据,确定该视频文件的至少一个静音点;根据该视频数据获取该视频文件的判断片段,该判断片段包括该视频文件的主持人镜头片段、标题片段和字幕片段中的至少一种片段;根据该判断片段,在该至少一个静音点中确定该视频文件的事件分割点。另一方面,本专利技术实施例提供了一种分析视频文件的装置,该装置包括:第一获取模块,用于获取视频文件的音频数据和视频数据;第一确定模块,用于根据该第一获取模块获取的该音频数据,确定该视频文件的至少一个静音点;第二获取模块,用于根据该第一获取模块获取的该视频数据,获取该视频文件的判断片段,该判断片段包括该视频文件的主持人镜头片段、标题片段和字幕片段中的至少一种片段;第二确定模块,用于根据该第二获取模块获取的该判断片段,在该第一确定模块确定的该至少一个静音点中,确定该视频文件的事件分割点。基于上述技术方案,本专利技术实施例的分析视频文件的方法和装置,通过获取视频文件的至少一个静音点和判断片段,并根据该判断片段在该至少一个静音点中确定该视频文件的事件分割点,能够准确地确定事件分割点,从而能够准确地对视频文件进行事件分割,并由此能够提高视频编目的效率和准确性。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据本专利技术实施例的分析视频文件的方法的示意性流程图。图2是根据本专利技术实施例的分析视频文件的方法的另一示意性流程图。图3是根据本专利技术实施例的确定静音点的方法的示意性流程图。图4是根据本专利技术实施例的确定静音点的方法的另一示意性流程图。图5是根据本专利技术实施例的确定静音点的方法的再一示意性流程图。图6是根据本专利技术实施例的分析视频文件的方法的再一示意性流程图。图7是根据本专利技术实施例的分析视频文件的装置的示意性框图。图8是根据本专利技术实施例的分析视频文件的装置的另一示意性框图。图9是根据本专利技术实施例的第一确定模块的示意性框图。图10是根据本专利技术实施例的第一确定模块的另一示意性框图。图11是根据本专利技术实施例的第五确定单元的示意性框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术的一部分实施例,而不是全部实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本专利技术保护的范围。图1示出了根据本专利技术实施例的分析视频文件的方法100的示意性流程图。如图1所示,该方法100包括:S110,获取视频文件的音频数据和视频数据;S120,根据该音频数据,确定该视频文件的至少一个静音点;S130,根据该视频数据获取该视频文件的判断片段,该判断片段包括该视频文件的主持人镜头片段、标题片段和字幕片段中的至少一种片段;S140,根据该判断片段,在该至少一个静音点中确定该视频文件的事件分割点。分析视频文件的装置可以根据视频文件的音频数据和视频数据,获取该视频文件的至少一个静音点以及判断片段,该判断片段可以包括该视频文件的主持人镜头片段、标题片段和字幕片段中的至少一种片段,由此,该装置可以根据该判断片段,在该至少一个静音点中确定该视频文件的事件分割点。因此,本专利技术实施例的分析视频文件的方法,通过获取视频文件的至少一个静音点和判断片段,并根据该判断片段在该至少一个静音点中确定该视频文件的事件分割点,能够准确地确定事件分割点,从而能够准确地对视频文件进行事件分割,并由此能够提高视频编目的效率和准确性。在S110中,对于需要分析的视频文件,可以通过对该视频文件进行音视频分离,获取该视频文件的音频数据和视频数据。例如,可以利用视频解码器将视频文件进行音视频分离。应理解,在本专利技术实施例中,视频文件可以包括各种类型的视频文件,例如新闻视频、娱乐视频、科教视频等。为了更好地示出本专利技术,在下文的描述中,将以视频文件包括新闻视频为例进行说明,但本专利技术实施例并不限于此。在S120中,根据该音频数据,可以确定该视频文件包括的至少一个静音点。例如,可以对与主持人镜头片段相应的音频数据进行静音分析,检测其中可能包括事件分割点的静音点;也可以对与非文字片段相应的音频数据进行静音分析,确定其中可能包括事件分割点的静音点。当然,也可以对其它音频数据进行静音分析并确定静音点。在S130中,根据该视频数据可以获取该视频文件的判断片段,其中该判断片段可以包括该视频文件的主持人镜头片段、标题片段和字幕片段中的至少一种片段。应理解,该判断片段也可以包括其它用于确定静音点是否为事件分割点的片段,例如非主持人镜头片段、镜头切换片段等。在本专利技术实施例中,可选地,基于人脸识别方法,本文档来自技高网
...
分析视频文件的方法和装置

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种分析视频文件的方法,其特征在于,包括:获取视频文件的音频数据和视频数据;根据所述音频数据,确定所述视频文件的至少一个静音点;根据所述视频数据获取所述视频文件的判断片段,所述判断片段包括所述视频文件的主持人镜头片段、标题片段和字幕片段中的至少一种片段;根据所述判断片段,在所述至少一个静音点中确定所述视频文件的事件分割点,其中,所述根据所述音频数据,确定所述视频文件的至少一个静音点,包括:根据所述音频数据,获取与所述视频数据包括的非文字片段相应的非文字片段音频数据;在所述非文字片段音频数据中确定第一静音片段;在与所述第一静音片段相应的视频数据中,确定镜头切换点;将所述镜头切换点确定为所述第一静音片段的静音点。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述事件分割点,确定所述视频文件包括的事件片段;根据所述视频文件获取与所述事件片段相应的事件信息,所述事件信息包括主持人信息、被访问人信息、标题信息和字幕信息中的至少一种;将所述事件信息确定为所述事件片段的元数据。3.根据权利要求1或2所述的方法,其特征在于,所述确定所述视频文件的至少一个静音点,包括:根据所述音频数据,获取与所述主持人镜头片段相应的主持人镜头片段音频数据;在所述主持人镜头片段音频数据中确定第二静音片段;在所述第二静音片段中确定第三静音片段,所述第三静音片段包括的静音片段的长度比所述第二静音片段中除所述第三静音片段之外的静音片段的长度长;将所述第三静音片段中各静音片段的中点确定为所述静音点。4.根据权利要求3所述的方法,其特征在于,所述在所述第二静音片段中确定第三静音片段,包括:确定所述第二静音片段包括的所有静音片段的长度的平均值;将所述第二静音片段中长度大于或等于所述平均值的静音片段确定为所述第三静音片段。5.根据权利要求1或2所述的方法,其特征在于,所述根据所述视频数据获取所述视频文件的判断片段,包括:基于人脸识别方法,在所述视频数据中获取所述视频文件的主持人镜头片段。6.根据权利要求3所述的方法,其特征在于,所述根据所述视频数据获取所述视频文件的判断片段,包括:基于人脸识别方法,在所述视频数据中获取所述视频文件的主持人镜头片段。7.根据权利要求4所述的方法,其特征在于,所述根据所述视频数据获取所述视频文件的判断片段,包括:基于人脸识别方法,在所述视频数据中获取所述视频文件的主持人镜头片段。8.一种分析视频文件的装置,其特征在于,包括:第一获取模块,用于获取视频文件的音频数据和视频数据;第一确定模块,用于根据所述第一获取模块获取的所述音频数据,确定所述视频文件的至少一个静音点;第二获取模块,用于根据所述第一获取模块获取的...

【专利技术属性】
技术研发人员:杨杰
申请(专利权)人:华为技术有限公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1