多媒体文件的情节片段的识别方法及装置制造方法及图纸

技术编号:10322297 阅读:150 留言:0更新日期:2014-08-14 09:33
本发明专利技术提供一种多媒体文件的情节片段的识别方法及装置。本发明专利技术实施例通过利用对象跟踪技术,对所确定的多媒体文件所包括的至少两帧图像进行识别处理,以获得目标文件片段,以及根据所确定的多媒体文件的字幕内容和字幕时间,获得目标字幕片段,使得能够根据所述目标文件片段和所述目标字幕片段,确定所述多媒体文件的情节片段,无需操作人员参与操作过程,操作简单,且正确率高,从而提高了情节片段识别的效率和可靠性。

【技术实现步骤摘要】
多媒体文件的情节片段的识别方法及装置
】本专利技术涉及多媒体技术,尤其涉及一种多媒体文件的情节片段的识别方法及装置。【
技术介绍
】多媒体文件例如,视频文件一般可以包括多个情节片段,对情节片段进行有效的识别,能够为多媒体文件的处理带来更多益处。例如,播放多媒体文件时,展示各个情节片段的播放操作标识,例如,在播放时间轴上的小白点等,以供用户很容易找到感兴趣的内容进行有选择地观看。现有技术中,操作人员可以逐一对多媒体文件进行人工识别,以识别该多媒体文件的情节片段。然而,现有的情节片段的识别操作复杂,且容易出错,从而导致了情节片段识别的效率和可靠性的降低。【
技术实现思路
】本专利技术的多个方面提供一种多媒体文件的情节片段的识别方法及装置,用以提高情节片段识别的效率和可靠性。本专利技术的一方面,提供一种多媒体文件的情节片段的识别方法,包括: 获取待处理的多媒体文件,所述多媒体文件包括至少两帧图像;利用对象跟踪技术,对所述至少两帧图像进行识别处理,以获得目标文件片段;根据所述多媒体文件的字幕内容和字幕时间,获得目标字幕片段;根据所述目标文件片段和所述目标字幕片段,确定所述多媒体文件的情节片段。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述利用对象跟踪技术,对所述至少两帧图像进行识别处理,以获得目标文件片段,包括:利用对象跟踪技术,提取所述至少两帧图像中出现目标对象的图像,以获得至少两个候选文件片段;根据所述至少两个候选文件片段中相邻的候选文件片段之间的第一时间间隔和预先设置的第一时间阈值,对相邻的候选文件片段进行合并处理,以获得所述目标文件片段。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述多媒体文件的字幕内容和字幕时间,获得目标字幕片段,包括:根据所述多媒体文件的字幕内容和字幕时间,获得至少两个候选字幕片段;根据所述至少两个候选字幕片段中相邻的候选字幕片段之间的第二时间间隔和预先设置的第二时间阈值,对相邻的候选字幕片段进行合并处理,以获得所述目标字幕片段。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述目标文件片段和所述目标字幕片段,确定所述多媒体文件的情节片段,包括:根据所述目标文件片段和所述目标字幕片段,获得至少一个融合文件片段;根据所述至少一个融合文件片段中相邻的融合文件片段之间的第三时间间隔和预先设置的第三时间阈值,对相邻的融合文件片段进行合并处理,以获得所述多媒体文件的情节片段。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述目标文件片段和所述目标字幕片段,确定所述多媒体文件的情节之后,还包括:根据所述情节片段所对应的时间范围,获得切割字幕内容;根据所述切割字幕内容,获得每个情节片段的情节内容描述。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述目标文件片段和所述目标字幕片段,确定所述多媒体文件的情节之后,还包括:根据所述情节片段所对应的时间范围,获得可播放时间,以供根据所述可播放时间,进行所述多媒体文件的播放。本专利技术的另一方面,提供一种多媒体文件的情节片段的识别装置,包括:获取单元,用于获取待处理的多媒体文件,所述多媒体文件包括至少两帧图像;文件处理单元,用于利用对象跟踪技术,对所述至少两帧图像进行识别处理,以获得目标文件片段;字幕处理单元,用于根据所述多媒体文件的字幕内容和字幕时间,获得目标字幕片段;决策单元,用于根据所述目标文件片段和所述目标字幕片段,确定所述多媒体文件的情节片段。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述文件处理单元,具体用于利用对象跟踪技术,提取所述至少两帧图像中出现目标对象的图像,以获得至少两个候选文件片段;以及根据所述至少两个候选文件片段中相邻的候选文件片段之间的第一时间间隔和预先设置的第一时间阈值,对相邻的候选文件片段进行合并处理,以获得所述目标文件片段。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述字幕处理单元,具体用于根据所述多媒体文件的字幕内容和字幕时间,获得至少两个候选字幕片段;以及根据所述至少两个候选字幕片段中相邻的候选字幕片段之间的第二时间间隔和预先设置的第二时间阈值,对相邻的候选字幕片段进行合并处理,以获得所述目标字幕片段。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述决策单元,具体用于根据所述目标文件片段和所述目标字幕片段,获得至少一个融合文件片段;以及根据所述至少一个融合文件片段中相邻的融合文件片段之间的第三时间间隔和预先设置的第三时间阈值,对相邻的融合文件片段进行合并处理,以获得所述多媒体文件的情节片段。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述字幕处理单元,还用于根据所述情节片段所对应的时间范围,获得切割字幕内容;以及根据所述切割字幕内容,获得每个情节片段的情节内容描述。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述文件处理单元,还用于根据所述情节片段所对应的时间范围,获得可播放时间,以供根据所述可播放时间,进行所述多媒体文件的播放。由上述技术方案可知,本专利技术实施例通过利用对象跟踪技术,对所确定的多媒体文件所包括的至少两帧图像进行识别处理,以获得目标文件片段,以及根据所确定的多媒体文件的字幕内容和字幕时间,获得目标字幕片段,使得能够根据所述目标文件片段和所述目标字幕片段,确定所述多媒体文件的情节片段,无需操作人员参与操作过程,操作简单,且正确率高,从而提高了情节片段识别的效率和可靠性。另外,采用本专利技术提供的技术方案,无需操作人员参与操作过程,即能实现情节片段的自动识别,因此,能够有效提高情节片段的识别成本。【【附图说明】】 为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例提供的多媒体文件的情节片段的识别方法的流程示意图;图2为本专利技术另一实施例提供的多媒体文件的情节片段的识别装置的结构示意图。【【具体实施方式】】为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本专利技术保护的范围。需要说明的是,本专利技术实施例中所涉及的终端可以包括但不限于手机、个人数字助理(Personal Digital Assistant, PDA)、无线手持装置、无线上网本、个人电脑(Personal Computer, PC)、便携电脑、MP3播放器、MP4播放器等。另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。图1为本专利技术一实施例本文档来自技高网...
多媒体文件的情节片段的识别方法及装置

【技术保护点】
一种多媒体文件的情节片段的识别方法,其特征在于,包括:获取待处理的多媒体文件,所述多媒体文件包括至少两帧图像;利用对象跟踪技术,对所述至少两帧图像进行识别处理,以获得目标文件片段;根据所述多媒体文件的字幕内容和字幕时间,获得目标字幕片段;根据所述目标文件片段和所述目标字幕片段,确定所述多媒体文件的情节片段。

【技术特征摘要】
1.一种多媒体文件的情节片段的识别方法,其特征在于,包括: 获取待处理的多媒体文件,所述多媒体文件包括至少两帧图像; 利用对象跟踪技术,对所述至少两帧图像进行识别处理,以获得目标文件片段; 根据所述多媒体文件的字幕内容和字幕时间,获得目标字幕片段; 根据所述目标文件片段和所述目标字幕片段,确定所述多媒体文件的情节片段。2.根据权利要求1所述的方法,其特征在于,所述利用对象跟踪技术,对所述至少两帧图像进行识别处理,以获得目标文件片段,包括: 利用对象跟踪技术,提取所述至少两帧图像中出现目标对象的图像,以获得至少两个候选文件片段; 根据所述至少两个候选文件片段中相邻的候选文件片段之间的第一时间间隔和预先设置的第一时间阈值,对相邻的候选文件片段进行合并处理,以获得所述目标文件片段。3.根据权利要求1所述的方法,其特征在于,所述根据所述多媒体文件的字幕内容和字幕时间,获得目标字幕片段,包括: 根据所述多媒体文件的字幕内容和字幕时间,获得至少两个候选字幕片段; 根据所述至少两个候选字幕片段中相邻的候选字幕片段之间的第二时间间隔和预先设置的第二时间阈值, 对相邻的候选字幕片段进行合并处理,以获得所述目标字幕片段。4.根据权利要求1~3任一权利要求所述的方法,其特征在于,所述根据所述目标文件片段和所述目标字幕片段,确定所述多媒体文件的情节片段,包括: 根据所述目标文件片段和所述目标字幕片段,获得至少一个融合文件片段; 根据所述至少一个融合文件片段中相邻的融合文件片段之间的第三时间间隔和预先设置的第三时间阈值,对相邻的融合文件片段进行合并处理,以获得所述多媒体文件的情节片段。5.根据权利要求1~4任一权利要求所述的方法,其特征在于,所述根据所述目标文件片段和所述目标字幕片段,确定所述多媒体文件的情节之后,还包括: 根据所述情节片段所对应的时间范围,获得切割字幕内容; 根据所述切割字幕内容,获得每个情节片段的情节内容描述。6.根据权利要求1~4任一权利要求所述的方法,其特征在于,所述根据所述目标文件片段和所述目标字幕片段,确定所述多媒体文件的情节之后,还包括: 根据...

【专利技术属性】
技术研发人员:由清圳
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1