视频场景切换的检测方法及装置制造方法及图纸

技术编号：40819692 阅读：4 留言：0更新日期：2024-03-28 19:38

本发明专利技术本发明专利技术涉及视频处理技术领域，公开了一种视频场景切换的检测方法及装置，该方法包括：对待检测视频进行处理，得到待检测视频对应的目标视频帧序列，将目标视频帧序列输入到场景切换检测模型中进行分析，得到模型输出，判断目标视频帧序列中每一帧视频帧对应的镜头切换帧置信度是否大于预设的置信度阈值，当该镜头切换帧置信度大于置信度阈值时，确定该帧视频帧为镜头切换帧。可见，实施本发明专利技术能够通过模型输出的置信度确定待检测视频中的视频帧是否为镜头切换帧，提高镜头切换帧的确定效率和确定准确性，有助于提高对视频的结构化拆解效率，进而有助于提高对视频素材的分析效率，提高用户使用体验。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及视频处理，尤其涉及一种视频场景切换的检测方法及装置。

技术介绍

1、随着近年来短视频平台的爆火，通过短视频进行电商广告宣传逐渐成为主流，对短视频进行拆解以分析短视频带货量变得十分重要。

2、现有技术中，通常通过识别视频场景切换帧对短视频进行拆解，识别视频场景切换帧常用方法包括对视频进行等间隔抽针，然后计算帧与帧之间的相似度来确定视频的场景切换帧，这种方法在面对复杂的视频场景时确定视频场景切换帧的识别效率和精准度较低。因此，提出一种能够提高确定视频场景切换帧的识别效率和精准度的技术方案显得尤为重要。

技术实现思路

1、本专利技术提供了一种视频场景切换的检测方法及装置，能够有利于提高确定视频场景切换帧的识别效率和精准度。

2、为了解决上述技术问题，本专利技术第一方面公开了一种视频场景切换的检测方法，所述方法包括：

3、对待检测视频进行处理，得到所述待检测视频对应的目标视频帧序列，所述目标视频帧序列包括初始视频帧序列和帧差分图序列；

4、将所述目标视频帧序列输入到预先训练的场景切换检测模型中进行分析，得到所述待检测视频对应的模型输出，所述模型输出包括所述目标视频帧序列中每一帧视频帧对应的镜头切换帧置信度；

5、对于所述目标视频帧序列中每一帧视频帧，判断每一帧所述视频帧对应的镜头切换帧置信度是否大于预设的置信度阈值，当该帧视频帧对应的镜头切换帧置信度大于所述置信度阈值时，确定该帧视频帧为镜头切换帧。

6、

7、将所述目标视频帧序列输入到预先训练的场景切换检测模型中，并基于所述场景切换检测模型对所述目标视频帧序列进行特征处理，得到所述目标视频帧序列对应的特征维度集合，所述特征维度集合包括所述初始视频帧序列对应的第一特征维度和所述帧差分图序列对应的第二特征维度；

8、拼接所述第一特征维度和所述第二特征维度，得到所述待检测视频的拼接维度；

9、对所述拼接维度进行特征编码，得到编码拼接维度，并根据预设的输出标准对所述编码特征维度进行维度调整，得到所述待检测视频对应的模型输出。

10、作为一种可选的实施方式，在本专利技术第一方面中，所述基于所述场景切换检测模型对所述目标视频帧序列进行特征处理，得到所述目标视频帧序列对应的特征维度集合，包括：

11、基于所述场景切换检测模型中的embedding层，按照预设的设卷积参数对所述目标视频帧序列进行第一子特征处理，得到第一子特征处理结果；

12、基于所述场景切换检测模型中的transformer编码层，对所述第一子特征处理结果进行第二子特征处理，得到第二子特征处理结果；

13、基于所述场景切换检测模型中的全连接层，对所述第二子特征处理结果进行第三子特征处理，得到所述目标视频帧序列对应的特征维度集合。

14、作为一种可选的实施方式，在本专利技术第一方面中，所述对待检测视频进行处理，得到所述待检测视频对应的目标视频帧序列，包括：

15、获取预设的抽帧间隔，并根据所述抽帧间隔对所述待检测视频进行抽帧，得到抽帧视频帧序列；

16、按照预设的视频帧尺寸要求对所述抽帧视频帧序列进行视频帧尺寸缩放，得到初始视频帧序列；

17、对于所述初始视频帧序列中的每一帧初始视频帧，将该初始视频帧以及与该初始视频帧相邻的且时序在后的初始视频帧进行差分运算，得到该初始视频帧对应的帧差分图；

18、将所有所述初始视频帧对应的帧差分图确定为帧差分图序列，并根据所述初始视频帧序列和所述帧差分图序列确定所述待检测视频对应的目标视频帧序列。

19、作为一种可选的实施方式，在本专利技术第一方面中，所述方法还包括：

20、确定场景切换检测模型对应的功能需求信息，并根据所述功能需求信息和预设的基础模型框架，生成初始场景切换检测模型，所述初始场景切换检测模型包括embedding层、transformer编码层和全连接层；

21、将预设的测试数据输入到所述初始场景切换检测模型中进行分析，得到所述测试数据对应的测试输出；

22、根据所述功能需求信息确定所述测试数据对应的标准输出标签，并根据所述测试输出和所述标准输出标签确定所述测试数据对应的训练损失；

23、判断所述训练损失与预设的损失阈值之间的目标关系，当所述目标关系表示所述训练损失大于所述损失阈值时，根据所述训练损失对所述初始场景切换检测模型进行更新训练；

24、当所述目标关系表示所述训练损失小于或等于所述损失阈值时，确定所述初始场景切换检测模型作为所述场景切换检测模型。

25、作为一种可选的实施方式，在本专利技术第一方面中，所述测试输出包括所述测试数据对应的每一帧视频帧的第一测试置信度，所述标准输出标签包括与所述测试数据对应的每一帧视频帧的标准置信度；

26、所述根据所述测试输出和所述标准输出标签确定所述测试数据对应的训练损失，包括：

27、将所述测试输出输入到预设的激活函数中，通过所述激活函数将所述测试输出中的每个所述第一测试置信度映射到预设的目标范围内，得到映射测试输出，所述映射测试输出包括每个所述第一测试置信度对应的第二测试置信度；

28、计算所述映射测试输出中的每个所述第二测试置信度与所述标准输出标签中的每个所述标准置信度之间的二值交叉熵损失；

29、根据每个所述二值交叉熵损失，计算所述测试数据对应的平均损失，作为所述测试数据对应的训练损失。

30、作为一种可选的实施方式，在本专利技术第一方面中，所述根据所述功能需求信息确定所述测试数据对应的标准输出标签，包括：

31、根据所述功能需求信息，确定所述场景切换检测模型的使用场景对应的置信度取值信息；

32、根据所述置信度取值信息确定所述测试数据对应的初始输出标签；

33、根据预设的平滑度参数对所述初始输出标签进行平滑处理，得到所述测试数据对应的标准输出标签。

34、本专利技术第二方面公开了一种视频场景切换的检测装置，所述装置包括：

35、处理模块，用于对待检测视频进行处理，得到所述待检测视频对应的目标视频帧序列，所述目标视频帧序列包括初始视频帧序列和帧差分图序列；

36、分析模块，用于将所述目标视频帧序列输入到预先训练的场景切换检测模型中进行分析，得到所述待检测视频对应的模型输出，所述模型输出包括所述目标视频帧序列中每一帧视频帧对应的镜头切换帧置信度；

37、判断模块，用于对于所述目标视频帧序列中每一帧视频帧，判断每一帧所述视频帧对应的镜头切换帧置信度是否大于预设的置信度阈值，当该帧视频帧对应的镜头切换帧置信度大于所述置信度阈值时，确定该帧视频帧为镜头切换帧。<本文档来自技高网...

【技术保护点】

1.一种视频场景切换的检测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的视频场景切换的检测方法，其特征在于，所述将所述目标视频帧序列输入到预先训练的场景切换检测模型中进行分析，得到所述待检测视频对应的模型输出，包括：

3.根据权利要求2所述的视频场景切换的检测方法，其特征在于，所述基于所述场景切换检测模型对所述目标视频帧序列进行特征处理，得到所述目标视频帧序列对应的特征维度集合，包括：

4.根据权利要求1-3任一项所述的视频场景切换的检测方法，其特征在于，所述对待检测视频进行处理，得到所述待检测视频对应的目标视频帧序列，包括：

5.根据权利要求1-3任一项所述的视频场景切换的检测方法，其特征在于，所述方法还包括：

6.根据权利要求5所述的视频场景切换的检测方法，其特征在于，所述测试输出包括所述测试数据对应的每一帧视频帧的第一测试置信度，所述标准输出标签包括与所述测试数据对应的每一帧视频帧的标准置信度；

7.根据权利要求5所述的视频场景切换的检测方法，其特征在于，所述根据所述功能需求信息确定所述测试

8.一种视频场景切换的检测装置，其特征在于，所述装置包括：

9.一种视频场景切换的检测装置，其特征在于，所述装置包括：

10.一种计算机存储介质，其特征在于，所述计算机存储介质存储有计算机指令，所述计算机指令被调用时，用于执行如权利要求1-7任一项所述的视频场景切换的检测方法。

...

【技术特征摘要】

1.一种视频场景切换的检测方法，其特征在于，所述方法包括：

5.根据权利要求1-3任一项所述的视频场景切换的检测方法，其特征在于，所述方...

【专利技术属性】
技术研发人员：陈畅新，陈莹莹，
申请(专利权)人：有米科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人