一种视频数据的切分方法和装置制造方法及图纸

技术编号:11738265 阅读:80 留言:0更新日期:2015-07-15 20:13
本发明专利技术实施例提供了一种视频数据的切分方法和装置,该方法包括:从视频数据中分离音频数据和视频图像数据;对所述音频数据和所述视频图像数据进行视频特征检测,以获得一个或多个候选切分点;从所述一个或多个候选切分点中选取一个或多个目标切分点;按照所述一个或多个目标切分点对所述视频数据进行切分,以获得多个视频子数据。本发明专利技术实施例实现了视频数据的自动切分,大大减少了人工干预的操作,大大减少了切分的时间和人力成本。

【技术实现步骤摘要】

本专利技术涉及视频数据处理
,特别是涉及一种视频数据的切分方法和一种视频数据的切分装置。
技术介绍
近年来,随着互联网的高速发展,网上的信息量急剧增加,其中包含了大量的视频数据,例如,新闻视频、综艺类节目等等。由于许多视频数据都是一个大的整体,里面包含多个段落,例如,在一个完整的新闻视频中,往往包括了多则新闻片段。因此,往往需要对视频数据进行切分,以获得所包含的段落。现在诸如新闻视频的切分等都是基于依赖人工进行的,即人工判断切分的位置,这往往需要人工浏览视频的每一帧,工作量巨大,耗费大量的时间、人力成本。由于在网络环境中视频数量的在高速增长中,人工切分视频数据的方式在时间和人力成本上越来越高,以至于无法承受。
技术实现思路
鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种视频数据的切分方法和相应的一种视频数据的切分装置。为了解决上述问题,本专利技术实施例公开了一种视频数据的切分方法,包括:从视频数据中分离音频数据和视频图像数据;对所述音频数据和所述视频图像数据进行视频特征检测,以获得一个或多个候选切分点;从所述一个或多个候选切分点中选取一个或多个目标切分点;按照所述一个或多个目标切分点对所述视频数据进行切分,以获得多个视频子数据。优选地,所述候选切分点包括第一候选切分点;所述对所述音频数据和所述视频图像数据进行视频特征检测,以获得一个或多个候选切分点的步骤包括:对所述音频数据进行语音活动检测,以获得静音点;将所述静音点关联的第一时间设置为第一候选切分点。优选地,所述候选切分点包括第二候选切分点;所述对所述音频数据和所述视频图像数据进行视频特征检测,以获得一个或多个候选切分点的步骤包括:所述视频图像数据进行镜头边界检测,以获得镜头边界;将所述镜头边界关联的第二时间设置为第二候选切分点。优选地,所述候选切分点包括第三候选切分点;所述对所述音频数据和所述视频图像数据进行视频特征检测,以获得一个或多个候选切分点的步骤包括:对所述视频图像数据进行标题检测,以获得标题信息;将所述标题信息关联的第三时间设置为第三候选切分点。优选地,所述候选切分点包括第四候选切分点;所述对所述音频数据和所述视频图像数据进行视频特征检测,以获得一个或多个候选切分点的步骤包括:对所述视频图像数据进行人物检测,以获得指定的人物对象;将所述指定的人物对象关联的第四时间设置为第四候选切分点。优选地,所述候选切分点包括第五候选切分点;所述对所述音频数据和所述视频图像数据进行视频特征检测,以获得一个或多个候选切分点的步骤包括:对文本信息进行文本检测,以获得内容相同或相似的目标文本信息,其中,所述文本信息为对所述音频数据进行语音识别所获得的文本;将所述目标文本信息关联的第五时间设置为第五候选切分点。优选地,所述对所述音频数据和所述视频图像数据进行视频特征检测,以获得一个或多个候选切分点的步骤包括:从所述视频图像数据中检测与预设的样本视频图像数据相同或相似的目标视频图像数据;对候选音频数据和候选视频图像数据进行视频特征检测,以获得一个或多个候选切分点;其中,候选音频数据和候选视频图像数据为时间位于所述目标视频图像数据之后的视频音频数据和视频图像数据。优选地,所述从所述一个或多个候选切分点中选取一个或多个目标切分点的步骤包括:从所述一个或多个候选切分点中选取重叠的一个或多个目标切分点。优选地,所述从所述一个或多个候选切分点中选取重叠的一个或多个目标切分点的步骤包括:从所述第一候选切分点与所述第二候选切分点中提取重叠的第一重叠切分点;从所述第一重叠切分点,与,所述第三候选切分点和所述第四候选切分点中提取重叠的第二重叠切分点;从所述第二重叠切分点与所述第五候选切分点中提取重叠的第三重叠切分点,作为目标切分点。优选地,该方法还包括:采用所述多个视频子数据对应的文本信息多个生成多个摘要信息。优选地,该方法还包括:结合所述多个视频子数据、所述多个视频子数据对应的摘要信息和所述多个视频子数据对应的标题信息,以生成多个节目数据。本专利技术实施例还公开了一种视频数据的切分装置,包括:分离模块,用于从视频数据中分离音频数据和视频图像数据;特征检测模块,用于对所述音频数据和所述视频图像数据进行视频特征检测,以获得一个或多个候选切分点;目标切分点选取模块,用于从所述一个或多个候选切分点中选取一个或多个目标切分点;切分模块,用于按照所述一个或多个目标切分点对所述视频数据进行切分,以获得多个视频子数据。优选地,所述候选切分点包括第一候选切分点;所述特征检测模块包括:语音活动检测子模块,用于对所述音频数据进行语音活动检测,以获得静音点;第一设置模块,用于将所述静音点关联的第一时间设置为第一候选切分点。优选地,所述候选切分点包括第二候选切分点;所述特征检测模块包括:镜头边界检测子模块,用于所述视频图像数据进行镜头边界检测,以获得镜头边界;第二设置模块,用于将所述镜头边界关联的第二时间设置为第二候选切分点。优选地,所述候选切分点包括第三候选切分点;所述特征检测模块包括:标题检测子模块,用于对所述视频图像数据进行标题检测,以获得标题信息;第三设置模块,用于将所述标题信息关联的第三时间设置为第三候选切分点。优选地,所述候选切分点包括第四候选切分点;所述特征检测模块包括:人物检测子模块,用于对所述视频图像数据进行人物检测,以获得指定的人物对象;第四设置模块,用于将所述指定的人物对象关联的第四时间设置为第四候选切分点。优选地,所述候选切分点包括第五候选切分点;所述特征检测模块包括:文本检测子模块,用于对文本信息进行文本检测,以获得内容相同或相似的目标文本信息,其中,所述文本信息为对所述音频数据进行语音识别所获得的文本;第五设置模块,用于将所述目标文本信息关联的第五时间设置为第五候选切分点。优选地,所述特征检测模块包括:重复场景检测子模块,用于从所述视频图像数据中检测与预设的样本视频图像数据相同或相似的目标视频图像数据;候选检测子模块,用于对候选音频数据和候选视频图像数据进行视频特征检测,以获得一个或多个候选切分点;其中,候选音频数据和候选视频图像数据为时间位于所述目标视频图像数据之后的视频音频数据和视频图像数据。优选地,所述目标切分点选取模块包括:重叠选取子模块,用于从所述一个或多个候选切分点中选取重叠的一个或多个目标切分点。优选地,所述重叠选取子模块包括:第一提取子模块,用于从所述第一候选切分点与所述第二候选切分点中提取重叠的第一重叠切分点;第二提取子模块,用于从所述第一重叠切分点,与,所述第三候选切分点和所述第四候选切分点中提取重叠的第二重叠切分点;当前第1页1 2 3 4 5 本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/62/CN104780388.html" title="一种视频数据的切分方法和装置原文来自X技术">视频数据的切分方法和装置</a>

【技术保护点】
一种视频数据的切分方法,其特征在于,包括:从视频数据中分离音频数据和视频图像数据;对所述音频数据和所述视频图像数据进行视频特征检测,以获得一个或多个候选切分点;从所述一个或多个候选切分点中选取一个或多个目标切分点;按照所述一个或多个目标切分点对所述视频数据进行切分,以获得多个视频子数据。

【技术特征摘要】

【专利技术属性】
技术研发人员:张彦刚王涛徐鹏项东涛
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1