一种基于内容的视频分段方法技术

技术编号:13306097 阅读:47 留言:0更新日期:2016-07-10 01:15
本发明专利技术公开了一种基于内容的视频分段方法。首先,利用字幕文件得到视频中的每一段话的内容和时间点,再利用每两段话之间的时间间隔,将贴近的话组合在一起作为一个较大的自然段,然后,对这个大的自然段进行分词处理,并对利用词和词之间的相似性,得到句子和句子之间的相似性,将相似性比较大的句子组合在一起作为一个自然段,然后根据对应的时间信息可以得到初步的视频分段位置。接着基于图像对视频进行镜头提取,再结合之前得到的分段位置,找到最终的准确分段位置。

【技术实现步骤摘要】

本专利技术设计视频处理
,自然语言处理技术,特别涉及视频分段方法。
技术介绍
科教视频是一种常见的视频类型,随着网络时代的来临,用户在观看科教视频的载体也从电视逐渐向电脑和网络变化。而在观看视频的时候,观众往往会选择快速跳跃,跳过不想观看的部分,观看他们感兴趣的内容。而在跳跃的过程中,用户很难准确地调整至准确的想观看的位置,都需要经过多次调整才能到达用户心目中满意的位置,这个过程十分影响观看体验性,所以将视频进行分段,用户在选择跳过本段内容时,可以通过视频本身给出的分段信息,准确快速地定位至下一段内容的开始处,而不用用户自己慢慢调整,这对视频网站来说,无疑是大大增加了其竞争力。目前视频自动分段的方案大都是使用基于场景检测的方法,将相同场景的视频划分为一段,将场景改变的帧设定为某一段的起点,但是一个视频往往会有大量的场景讲述同一件事,基于场景的分段会造成分段频率过高,甚至出现在几秒钟之内划分了数段的特殊情况出现,这都是不科学的分段方法。而具有标准的字幕文件的视频,可以从字幕的时间轴和具体内容出发,从自然语言的角度出发,分析出各段话之间的相似度,利用相似度进行分段,再利用这个分段信息,结合科教视频中比较清洗的场景上的变换,得到准确的分段信息。
技术实现思路
本专利技术的目的是为了解决科教视频的自动分段问题,提供了一种基于内容的自动分段方法。其特征在于包括以下步骤:由字幕文件提取出视频中的对话流S={s1,s2,s3,…,sn本文档来自技高网...

【技术保护点】
一种基于内容的视频分段方法,其特征在于包括以下步骤:S01:由字幕文件提取出视频中的对话流S={s1,s2,s3,…,sn},每一段对话的开始时间B={b1,b2,b3,…,bn},每一段对话的结束时间E={e1,e2,e3,…,en};S02:对于所有的相邻对话si,si‑1,设定一个阈值λ,当bi‑ei‑1<λ时,则令si,si‑1归为同一段,从而将对话流S划分为m段,其中第i段由从第k句话开始,一共由l段连续的对话组成,即si={sk,sk+1,sk+2,…sk+l‑1};S03:使用分词工具对每一句话sk进行分词,去除非实词后得到sk的词列表Ck={ck1,ck2,ck3,…,ckh};S04:通过以下公式求得任何两个句子sx和sy之间的相似度:其中f(cxi)为单词cxi词向量,f(cyi)为单词cyi词向量,由两个单词cxi,cyi的词向量的点积f(cxi)f(cyi)可以求得两个单词的相似度;S05:对于所有的Si,利用第4步求得Si中所有句子之间的相似度矩阵Mi,对Mi进行分割,得到对应对话的分割方法;S06:对整个视频利用视频的图像特征提取边缘镜头;S07:在文本找到的分段处附近找寻最适合的分割镜头:如果文本在视频中的分段处为一段时间,则在该段时间中寻找变化最大的镜头作为分割镜头;如果该段时间中不存在边缘镜头,则选取离该段时间最近的镜头作为分割镜头;如果文本在视频中的分段处为一帧,则选取距离该帧最接近的镜头作为分割镜头。...

【技术特征摘要】
1.一种基于内容的视频分段方法,其特征在于包括以下步骤:
S...

【专利技术属性】
技术研发人员:肖俊陈刘策
申请(专利权)人:杭州观通科技有限公司
类型:发明
国别省市:浙江;33

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1