【技术实现步骤摘要】
本专利技术设计视频处理
,自然语言处理技术,特别涉及视频分段方法。
技术介绍
科教视频是一种常见的视频类型,随着网络时代的来临,用户在观看科教视频的载体也从电视逐渐向电脑和网络变化。而在观看视频的时候,观众往往会选择快速跳跃,跳过不想观看的部分,观看他们感兴趣的内容。而在跳跃的过程中,用户很难准确地调整至准确的想观看的位置,都需要经过多次调整才能到达用户心目中满意的位置,这个过程十分影响观看体验性,所以将视频进行分段,用户在选择跳过本段内容时,可以通过视频本身给出的分段信息,准确快速地定位至下一段内容的开始处,而不用用户自己慢慢调整,这对视频网站来说,无疑是大大增加了其竞争力。目前视频自动分段的方案大都是使用基于场景检测的方法,将相同场景的视频划分为一段,将场景改变的帧设定为某一段的起点,但是一个视频往往会有大量的场景讲述同一件事,基于场景的分段会造成分段频率过高,甚至出现在几秒钟之内划分了数段的特殊情况出现,这都是不科学的分段方法。而具有标准的字幕文件的视频,可以从字幕的时间轴和具体内容出发,从自然语言的角度出发,分析出各段话之间的相似度,利用相似度进行分段,再利用这个分段信息,结合科教视频中比较清洗的场景上的变换,得到准确的分段信息。
技术实现思路
本专利技术的目的是为了解决科教视频的自动分段问题,提供了一种基于内容的自动分段方法。其特征在于包括以下步骤:由字幕文件提取出视频中的对话 ...
【技术保护点】
一种基于内容的视频分段方法,其特征在于包括以下步骤:S01:由字幕文件提取出视频中的对话流S={s1,s2,s3,…,sn},每一段对话的开始时间B={b1,b2,b3,…,bn},每一段对话的结束时间E={e1,e2,e3,…,en};S02:对于所有的相邻对话si,si‑1,设定一个阈值λ,当bi‑ei‑1<λ时,则令si,si‑1归为同一段,从而将对话流S划分为m段,其中第i段由从第k句话开始,一共由l段连续的对话组成,即si={sk,sk+1,sk+2,…sk+l‑1};S03:使用分词工具对每一句话sk进行分词,去除非实词后得到sk的词列表Ck={ck1,ck2,ck3,…,ckh};S04:通过以下公式求得任何两个句子sx和sy之间的相似度:其中f(cxi)为单词cxi词向量,f(cyi)为单词cyi词向量,由两个单词cxi,cyi的词向量的点积f(cxi)f(cyi)可以求得两个单词的相似度;S05:对于所有的Si,利用第4步求得Si中所有句子之间的相似度矩阵Mi,对Mi进行分割,得到对应对话的分割方法;S06:对整个视频利用视频的图像特征提取边缘镜头;S07:在文本找到 ...
【技术特征摘要】
1.一种基于内容的视频分段方法,其特征在于包括以下步骤:
S...
【专利技术属性】
技术研发人员:肖俊,陈刘策,
申请(专利权)人:杭州观通科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。