视频的分幕节点预测方法、装置、终端及存储介质制造方法及图纸

技术编号：32127321 阅读：22 留言：0更新日期：2022-01-29 19:18

本申请公开了一种视频的分幕节点预测方法、装置、终端及存储介质。方法包括：对视频数据进行特征提取，得到画面序列和音频序列；基于画面序列和音频序列，确定样本数据；从样本数据中提取预测样本数据，并将预测样本数据输入训练后的滑动窗体模型，得到预测样本数据对应的分幕节点的初始预测序列；对分幕节点的初始预测序列进行非极大值抑制操作以剔除所述预测样本数据中的冗余数据对应的分幕节点，得到目标数据对应的分幕节点的目标预测序列。本发明专利技术可提高滑动窗体模型对分幕节点识别的有效性以及预测的准确性，进而提高预测分幕节点的鲁棒性。的鲁棒性。的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
视频的分幕节点预测方法、装置、终端及存储介质

[0001]本申请涉及视频分幕
，具体而言，涉及一种视频的分幕节点预测方法、装置、终端及存储介质。

技术介绍

[0002]视频是一种时序性结构的数据，对视频内容进行分析才能提取更多的有效信息。然而，对视频内容的划分是对视频内容进行分析的前置任务，如何有效划分视频内容成为亟待解决的问题。
[0003]目前，在视频分析场景下，一般采用基于帧间画面对视频进行划分，以判断画面的分割点(即分幕节点)。
[0004]但是，采用上述方法对分割点进行预测存在准确度低的问题。

技术实现思路

[0005]本申请的主要目的在于提供一种视频的分幕节点预测方法、装置、终端及存储介质，以解决相关技术中对分割点进行预测存在准确度低的问题。
[0006]为了实现上述目的，第一方面，本申请提供了一种视频的分幕节点预测方法，包括：
[0007]对视频数据进行特征提取，得到画面序列和音频序列；
[0008]基于画面序列和音频序列，确定样本数据；
[0009]从样本数据中提取预测样本数据，并将预测样本数据输入训练后的滑动窗体模型，得到预测样本数据对应的分幕节点的初始预测序列；
[0010]对分幕节点的初始预测序列进行非极大值抑制操作以剔除所述预测样本数据中的冗余数据对应的分幕节点，得到目标数据对应的分幕节点的目标预测序列。
[0011]在一种可能的实现方式中，对视频数据进行特征提取，得到画面序列和音频序列，包括：
[0

【技术保护点】

【技术特征摘要】
1.一种视频的分幕节点预测方法，其特征在于，包括：对视频数据进行特征提取，得到画面序列和音频序列；基于所述画面序列和所述音频序列，确定样本数据；从所述样本数据中提取预测样本数据，并将所述预测样本数据输入训练后的滑动窗体模型，得到所述预测样本数据对应的分幕节点的初始预测序列；对所述初始预测序列进行非极大值抑制操作以剔除所述预测样本数据中的冗余数据对应的分幕节点，得到目标数据对应的分幕节点的目标预测序列。2.如权利要求1所述的视频的分幕节点预测方法，其特征在于，所述对视频数据进行特征提取，得到画面序列和音频序列，包括：分别利用C3D识别模型和VGGISH预训练模型以预设间隔对所述视频数据进行3D卷积特征和音频特征提取，得到所述画面序列和所述音频序列。3.如权利要求2所述的视频的分幕节点预测方法，其特征在于，所述基于所述画面序列和所述音频序列，确定样本数据，包括：将所述画面序列和所述音频序列进行拼接，得到拼接后的视频数据；利用预设窗体以预设步长对所述拼接后的视频数据进行窗体提取，得到窗体数据；基于所述窗体数据和所述窗体数据对应的标签值序列，构成所述样本数据。4.如权利要求3所述的视频的分幕节点预测方法，其特征在于，所述初始预测序列包括用于预测是否包含分幕节点的第一初始预测序列和用于预测分幕节点位置的第二初始预测序列；所述从所述样本数据中提取预测样本数据，并将所述预测样本数据输入训练后的滑动窗体模型，得到所述预测样本数据对应的分幕节点的初始预测序列，包括：在所述样本数据中随机选取预设数量的未标记有分幕节点数据的样本作为所述预测样本数据；将所述预测样本数据输入训练后的滑动窗体模型，待预设的loss函数中的分幕节点的置信度达到第一预设置信度阈值，输出所述预测样本数据对应的所述第一初始预测序列和所述第二初始预测序列。5.如权利要求4所述的视频的分幕节点预测方法，其特征在于，所述分幕节点的目标预测序列包括用于预测是否包含分幕节点的第一目标预测序列和用于预测分幕节点位置的第二目标预测序列；所述对所述分幕节点初始预测序列进行非极大值抑制操作以剔除所述预测样本数据...

【专利技术属性】
技术研发人员：王喆，李佳楠，范凌，
申请(专利权)人：特赞上海信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人