一种基于字幕视频的镜头边界检测与关键帧提取方法技术

技术编号：28943245 阅读：9 留言：0更新日期：2021-06-18 21:51

本公开提供一种基于字幕视频的镜头边界检测与关键帧提取方法，包括对视频流抽取视频帧序列，对其进行粗筛选，将粗筛选的每个帧图像分为上下两个区域；对每个帧图像的上区域提取图像特征，并计算相邻两帧之间的图像特征的余弦相似性，根据相似性确定表示场景内容变换的关键帧，得到第一目标关键视频帧序列；对每个帧图像的下区域提取文字区域，将存在文字区域的帧序列提取出来，并按照顺序排列，依次比较相邻帧文字区域的长度，如果长度变化相差预设数量的像素以上，则均判别为关键帧，获得第二目标关键视频帧序列；将两者进行整合，获得最终的目标关键视频帧序列。能够在消除冗余信息的同时极大利用文本信息达到更精确的效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于字幕视频的镜头边界检测与关键帧提取方法
本公开属于图像及视频处理
，具体涉及一种基于字幕视频的镜头边界检测与关键帧提取方法。
技术介绍
近年来，视频内容分析是计算机视觉领域中一大热门研究内容，可应用在不同的场景，如安防、影视、情报等。在大数据时代，作为视频处理的关键技术，视频内容分析将是实现大数据在各个应用领域落地的重要基础建设，而镜头边界检测和关键帧提取是其中不可或缺的一部分。新闻视频、影视视频以及纪实记录片多为配有字幕的视频，字幕作为解释和阐述视频内容的文本信息，包含了大量的有用信息，因此关键帧中必须包含这些重要的字幕信息。相较于无字幕的视频，字幕视频的视频序列变化主要包含如下特征：视频场景的变化与字幕变化不是同步的，即多个场景的变化可能伴随同一句字幕，而同一场景可能配有多句字幕。目前镜头边界检测以及关键帧提取算法多是基于比较视频序列之间的帧特征差异来检测镜头变化，通过提取视频帧序列的特征，然后利用这些特征量建立评判准则并设定阈值，以此判断场景是否发生变化，从而实现镜头边界检测与关键帧提取。这些算法在无字幕的视频中已经能取得不错的效果，但是由于在字幕视频中，字幕通常在视频场景中占用的面积较小，字幕变化与场景变换往往不同步，仅仅依靠基于视频序列之间的特征差异，往往会漏检带有重要信息的字幕帧，而降低镜头分割的阈值则会增加关键帧提取的冗余。
技术实现思路
本公开旨在至少解决现有技术中存在的技术问题之一，提供一种基于字幕视频的镜头边界检测与关键帧提取方法。本公开的...

【技术保护点】
1.一种基于字幕视频的镜头边界检测与关键帧提取方法，其特征在于，所述方法包括以下步骤：/n对视频流抽取视频帧序列，基于帧间差异特征对所述视频帧序列进行粗筛选，并将所述粗筛选的视频帧序列按在所述视频流的序号进行标号；/n将所述粗筛选的视频帧序列中的每个帧图像分为上下两个区域；/n分别对每个所述帧图像的上区域，基于FPN网络提取图像特征，并计算相邻两帧图像之间的图像特征的余弦相似性，设定阈值，如果相似性值大于阈值，则将第二帧作为镜头边界，并标记为表示场景内容变换的关键帧，得到第一目标关键视频帧序列；/n分别对每个所述帧图像的下区域，采用EAST算法检测并提取文字区域，将存在文字区域的帧序列提取出来，并将提取出来的视频帧序列按照顺序排列，依次比较相邻帧图像文字区域的长度，如果长度变化相差预设数量的像素以上，则均判别为关键帧；以及，对短文本帧再提取与长文本行所在帧同样位置的区域，计算两区域的相似性；若不相似则两帧都作为关键帧，若相似，则取前一帧为关键帧，获得第二目标关键视频帧序列；/n将所述第一目标关键视频帧序列和所述第二目标关键视频帧序列进行整合，获得最终的目标关键视频帧序列。/n

【技术特征摘要】
1.一种基于字幕视频的镜头边界检测与关键帧提取方法，其特征在于，所述方法包括以下步骤：
对视频流抽取视频帧序列，基于帧间差异特征对所述视频帧序列进行粗筛选，并将所述粗筛选的视频帧序列按在所述视频流的序号进行标号；
将所述粗筛选的视频帧序列中的每个帧图像分为上下两个区域；
分别对每个所述帧图像的上区域，基于FPN网络提取图像特征，并计算相邻两帧图像之间的图像特征的余弦相似性，设定阈值，如果相似性值大于阈值，则将第二帧作为镜头边界，并标记为表示场景内容变换的关键帧，得到第一目标关键视频帧序列；
分别对每个所述帧图像的下区域，采用EAST算法检测并提取文字区域，将存在文字区域的帧序列提取出来，并将提取出来的视频帧序列按照顺序排列，依次比较相邻帧图像文字区域的长度，如果长度变化相差预设数量的像素以上，则均判别为关键帧；以及，对短文本帧再提取与长文本行所在帧同样位置的区域，计算两区域的相似性；若不相似则两帧都作为关键帧，若相似，则取前一帧为关键帧，获得第二目标关键视频帧序列；
将所述第一目标关键视频帧序列和所述第二目标关键视频帧序列进行整合，获得最终的目标关键视频帧序列。

2.根据权利要求1所述的方法，其特征在于，所述对视频流抽取视频帧序列，基于帧间差异特征对所述视频帧序列进行粗筛选，包括：
每隔预设时长从所述视频流中抽取一帧图像，获得所述视频帧序列；
计算所述视频帧序列中的相邻两帧图像的差值矩阵；
根据所述差值矩阵包括的非零像素值，计算判定阈值；
根据所述判定阈值，确定当前帧图像是否为粗筛选视频关键帧。

3.根据权利要求2所述的方法，其特征在于，所述计算所述视频帧序列中的相邻两帧图像的差值矩阵，包括：
对抽取的帧图像进行灰度化处理，并用高斯滤波器对提取的每一帧图像对应的灰度图进行平滑处理；
按顺序对相邻帧图像进行灰度差值运算，即将当前帧图像对应的灰度图与上一帧图像对应的灰度图中对应位置处的像素灰度值相减，得到当前帧图像对应的差值矩阵。

4.根据权利要求3所述的方法，其特征在于，所述根据所述差值矩阵包括的非零像素值，计算判定阈值，包括：
计算所述差值矩阵包括的所有非零像素值的平均值及方差；
确定所述差值矩阵中像素值大于所述平均值的非零像素值的第一数量，及像素值大于所述方差的非零像素值的第二数量；
根据所述第一数量和所述第二数量，通过如下公式(1)计算所...

【专利技术属性】
技术研发人员：熊荔，王美涵，白立飞，刘灵芝，
申请(专利权)人：中国电子科技集团公司信息科学研究院，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人