视频切分方法、装置、设备、系统及存储介质制造方法及图纸

技术编号：31226990 阅读：18 留言：0更新日期：2021-12-08 09:34

本公开涉及一种视频切分方法、装置、设备、系统及存储介质，该方法包括：获取目标视频的视频特征数据，视频特征数据包括音频数据、字幕数据和镜头数据；对音频数据进行切分，得到多个音频数据片段；基于镜头数据对字幕数据进行切分，得到多个字幕子数据；基于音频数据片段和字幕子数据对目标视频进行切分，得到多个视频片段。根据本公开实施例，实现了能够准确的切分目标视频，以进一步使得用户通过浏览目标视频切分后的视频片段，从目标视频中快速获取准确的信息，以准确且快速的浏览目标视频中所包含的信息。所包含的信息。所包含的信息。

全部详细技术资料下载

【技术实现步骤摘要】
视频切分方法、装置、设备、系统及存储介质

[0001]本公开涉及视频处理
，尤其涉及一种视频切分方法、装置、设备、系统及存储介质。

技术介绍

[0002]随着数字媒体技术的高速发展，各种各样的视频急剧增加，例如，新闻视频、综艺视频、以及影音视频等。
[0003]为了使用户快速浏览视频中所包含的信息，需要对视频进行切分。但是，目前的视频切分方法只基于单一视频特征进行视频切分，视频切分的准确性较低，因此，不能使用户从视频中快速获取准确的信息。

技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题，本公开提供了一种视频切分方法、装置、设备、系统及存储介质。
[0005]第一方面，本公开提供了一种视频切分方法，该方法包括：获取目标视频的视频特征数据，视频特征数据包括音频数据、字幕数据和镜头数据，镜头数据基于镜头边缘检测技术切分得到；对音频数据进行切分，得到多个音频数据片段；基于镜头数据对所述字幕数据进行切分，得到多个字幕子数据；基于音频数据片段和字幕子数据对目标视频进行切分，得到多个视频片段。
[0006]第二方面，本公开提供了一种视频切分装置，该装置包括：视频特征数据获取模块，用于获取目标视频的视频特征数据，视频特征数据包括音频数据、字幕数据和镜头数据，镜头数据基于镜头边缘检测技术切分得到；音频数据切分模块，用于对音频数据进行切分，得到多个音频数据片段；字幕数据切分模块，用于基于镜头数据对所述字幕数据进行切分，得到多个字幕子数据；目标视频切分模块，用于基...

【技术保护点】

【技术特征摘要】
1.一种视频切分方法，其特征在于，包括：获取目标视频的视频特征数据，所述视频特征数据包括音频数据、字幕数据和镜头数据，所述镜头数据基于镜头边缘检测技术切分得到；对所述音频数据进行切分，得到多个音频数据片段；基于所述镜头数据对所述字幕数据进行切分，得到多个字幕子数据；基于所述音频数据片段和所述字幕子数据对所述目标视频进行切分，得到多个视频片段。2.根据权利要求1所述的方法，其特征在于，所述对所述音频数据进行切分，得到多个音频数据片段，包括：将所述音频数据中的纯音乐部分和无意义部分替换为空白数据，得到替换后的音频数据；基于所述空白数据，对所述替换后的音频数据进行切分，得到所述多个音频数据片段。3.根据权利要求1所述的方法，其特征在于，所述对所述音频数据进行切分，得到多个音频数据片段，包括：将所述音频数据输入预先训练好的转场语句识别模型，得到所述转场语句识别模型输出的转场数据；基于所述转场数据，对所述音频数据进行切分，得到所述多个音频数据片段。4.根据权利要求1所述的方法，其特征在于，所述音频数据包括多个第一音频子数据，每个所述第一音频子数据对应一个语句；其中，所述对所述音频数据进行切分，得到多个音频数据片段，包括：基于预设的正则表达式，在所述音频数据中识别转场数据；基于所述转场数据，对所述音频数据进行切分，得到所述多个音频数据片段。5.根据权利要求1
‑
4中任一项所述的方法，其特征在于，所述音频数据包括目标视频的语音文本。6.根据权利要求1所述的方法，其特征在于，每个所述字幕子数据对应同一个镜头场景；其中，在所述基于所述镜头数据对所述字幕数据进行切分，得到多个字幕子数据之后，所述方法还包括：将包含相同字幕的多个连续字幕子数据合并为一类，得到聚类后的字幕子数据；其中，所述基于所述音频数据片段和所述字幕子数据对所述目标视频进行切分，得到多个视频片段，包括：基于所述音频数据片段和所述聚类后的字幕子数据对所述目标视频进行切分，得到多个视频片段。7.根据权利要求6所述的方法，其特征在于，在所述将包含相同字幕的多个连续字幕子数据合并为一类，得到聚类后的字幕子数据之后，所述方法还包括：将紧密程度满足预设密度条件的多个初步聚类后的字幕子数据合并为一类，得到二次聚类后的字幕子数据；其中，所述基于所述音频数据片段和所述聚类后的字幕子数据对所述目标视频进行切分，得到多个视频片段，包括：
基于所述音频数据片段和所述二次聚类后的字幕子数据对所述目标视频进行切分，得到多个视频片段。8.根据权利要求1或权利要求6
‑
7中任一项所述的方法，其特征在于，所述字幕数据包括所述目标视频中的字幕文本。9.根据权利要求1所述的方法，其特征在于，所述基于所述音频数据片段和所述字幕子数据对所述目标视频进行切分，得到多个视频片段，包括：根据所述字幕子数据对所述音频数据片段进行修正，得到多个修正后的音频片段数据；基于所述多个修正后的音频片段数据，对所述目标视频进行切分，得到所述多个视频片段。10.根据权利要求9所述的方法，其特征在于，所述根据所述字幕子数据对所述音频数据片段进行修正，得到多个修正后的...

【专利技术属性】
技术研发人员：刘宏宇，马先钦，张佳旭，王璋盛，罗引，王磊，
申请(专利权)人：北京中科闻歌科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人