一种基于内容的视频分段方法技术

技术编号：13306097 阅读：47 留言：0更新日期：2016-07-10 01:15

本发明专利技术公开了一种基于内容的视频分段方法。首先，利用字幕文件得到视频中的每一段话的内容和时间点，再利用每两段话之间的时间间隔，将贴近的话组合在一起作为一个较大的自然段，然后，对这个大的自然段进行分词处理，并对利用词和词之间的相似性，得到句子和句子之间的相似性，将相似性比较大的句子组合在一起作为一个自然段，然后根据对应的时间信息可以得到初步的视频分段位置。接着基于图像对视频进行镜头提取，再结合之前得到的分段位置，找到最终的准确分段位置。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术设计视频处理
，自然语言处理技术，特别涉及视频分段方法。
技术介绍
科教视频是一种常见的视频类型，随着网络时代的来临，用户在观看科教视频的载体也从电视逐渐向电脑和网络变化。而在观看视频的时候，观众往往会选择快速跳跃，跳过不想观看的部分，观看他们感兴趣的内容。而在跳跃的过程中，用户很难准确地调整至准确的想观看的位置，都需要经过多次调整才能到达用户心目中满意的位置，这个过程十分影响观看体验性，所以将视频进行分段，用户在选择跳过本段内容时，可以通过视频本身给出的分段信息，准确快速地定位至下一段内容的开始处，而不用用户自己慢慢调整，这对视频网站来说，无疑是大大增加了其竞争力。目前视频自动分段的方案大都是使用基于场景检测的方法，将相同场景的视频划分为一段，将场景改变的帧设定为某一段的起点，但是一个视频往往会有大量的场景讲述同一件事，基于场景的分段会造成分段频率过高，甚至出现在几秒钟之内划分了数段的特殊情况出现，这都是不科学的分段方法。而具有标准的字幕文件的视频，可以从字幕的时间轴和具体内容出发，从自然语言的角度出发，分析出各段话之间的相似度，利用相似度进行分段，再利用这个分段信息，结合科教视频中比较清洗的场景上的变换，得到准确的分段信息。
技术实现思路
本专利技术的目的是为了解决科教视频的自动分段问题，提供了一种基于内容的自动分段方法。其特征在于包括以下步骤：由字幕文件提取出视频中的对话...

【技术保护点】
一种基于内容的视频分段方法，其特征在于包括以下步骤：S01：由字幕文件提取出视频中的对话流S＝{s1,s2,s3,…,sn}，每一段对话的开始时间B＝{b1,b2,b3,…,bn}，每一段对话的结束时间E＝{e1,e2,e3,…,en}；S02：对于所有的相邻对话si,si‑1，设定一个阈值λ，当bi‑ei‑1＜λ时，则令si,si‑1归为同一段，从而将对话流S划分为m段，其中第i段由从第k句话开始，一共由l段连续的对话组成，即si＝{sk,sk+1,sk+2,…sk+l‑1}；S03：使用分词工具对每一句话sk进行分词，去除非实词后得到sk的词列表Ck＝{ck1,ck2,ck3,…,ckh}；S04：通过以下公式求得任何两个句子sx和sy之间的相似度：其中f(cxi)为单词cxi词向量，f(cyi)为单词cyi词向量，由两个单词cxi,cyi的词向量的点积f(cxi)f(cyi)可以求得两个单词的相似度；S05：对于所有的Si，利用第4步求得Si中所有句子之间的相似度矩阵Mi，对Mi进行分割，得到对应对话的分割方法；S06：对整个视频利用视频的图像特征提取边缘镜头；S07：在文本找到...

【技术特征摘要】
1.一种基于内容的视频分段方法，其特征在于包括以下步骤：
S...

【专利技术属性】
技术研发人员：肖俊，陈刘策，
申请(专利权)人：杭州观通科技有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人