视频拆条方法和装置制造方法及图纸

技术编号：30424253 阅读：25 留言：0更新日期：2021-10-24 16:54

本申请提供了一种视频拆条方法和装置，根据多个模态的信息来决定视频拆分点，从而提高视频拆条的准确性。第一方面，提供了一种视频拆条方法，该方法包括：根据视频的镜头切换点和视频的语音停顿点获取视频的多个细粒度拆条片段；提取多个细粒度拆条片段中每个细粒度拆条片段的特征，特征包括图片特征、音频特征；根据第一神经网络模型对多个细粒度拆条片段的特征进行处理，以得到视频的拆分点预测序列，拆分点预测序列包括多个拆分点和多个拆分点对应的概率。点对应的概率。点对应的概率。

全部详细技术资料下载

【技术实现步骤摘要】
视频拆条方法和装置

[0001]本申请涉及视频加工领域，并且更具体地，涉及一种视频拆条方法和装置。

技术介绍

[0002]随着电视广播和互联网视频技术的发展，存储和视频采集设备成本的降低，以及各种智能终端设备的普及，海量视频被生产出来的同时，广大用户对各类视频的点播需求也越来越大。海量的视频需要经过二次加工后形成新媒体节目，最终再呈现给用户。视频拆条是将一段长的视频拆分成多个不同主题的片段，是视频二次加工中最主要和最重要的一个步骤。传统的视频拆条是由人工拆分，即工作人员先浏览视频素材，理解视频后再进行拆分。这种拆分方法效率低、实时性差，不能满足日益增长的多媒体市场需求。
[0003]已有的视频自动拆条方法只根据单个模态的信息来决策拆分点，对于结构复杂、内容多样的视频，这种拆条方法可能导致拆分不准确。

技术实现思路

[0004]本申请提供一种视频拆条方法和装置，根据多个模态的信息来决定视频拆分点，从而提高视频拆条的准确性。
[0005]第一方面，提供了一种视频拆条方法，该方法包括：根据视频的镜头切换点和视频的语音停顿点获取视频的多个细粒度拆条片段；提取多个细粒度拆条片段中每个细粒度拆条片段的特征，特征包括图片特征、音频特征；根据第一神经网络模型对多个细粒度拆条片段的特征进行处理，以得到视频的拆分点预测序列，拆分点预测序列包括多个拆分点和多个拆分点对应的概率。
[0006]对于结构复杂、内容多样的新闻视频或互联网视频，准确的拆条需要系统性的视频内容理解。视频拆条需要解决两个主要问题...

【技术保护点】

【技术特征摘要】
1.一种视频拆条方法，其特征在于，包括：根据视频的镜头切换点和所述视频的语音停顿点获取所述视频的多个细粒度拆条片段；提取所述多个细粒度拆条片段中每个细粒度拆条片段的特征，所述特征包括图片特征、音频特征；根据第一神经网络模型对所述多个细粒度拆条片段的特征进行处理，以得到所述视频的拆分点预测序列，所述拆分点预测序列包括多个拆分点和所述多个拆分点对应的概率。2.根据权利要求1所述的方法，其特征在于，所述特征还包括字幕特征。3.根据权利要求1或2所述的方法，其特征在于，所述第一神经网络模型为多模态融合拆条检测器模型。4.根据权利要求1至3中任一项所述的方法，其特征在于，所述根据第一神经网络模型对所述多个细粒度拆条片段的特征进行处理之前，所述方法还包括：对所述多个细粒度拆条片段的特征在时间维度上进行对齐。5.一种训练神经网络模型的方法，其特征在于，包括：获取训练数据，所述训练数据包括多个视频片段的特征和所述多个视频片段对应的标准拆分点序列，所述特征包括图片特征、音频特征；根据所述训练数据对初始神经网络模型进行训练；当所述神经网络模型根据所述多个视频片段的特征得到的所述视频的拆分点预测序列与所述标准拆分点序列的差异满足预设条件时，得到第一神经网络模型，所述拆分点预测序列包括一个或多个拆分点和所述一个或多个拆分点对应的概率。6.根据权利要求5所述的方法，其特征在于，所述特征还包括字幕特征。7.一种视频拆条装置，其特征在于，包括：处理器，用于根据视频的镜头切换点和所述视频的语音停顿点获取所述视频的多个细粒度拆条片段；所述处理器还用于，提取所述多个细粒度拆条片段中每个细粒度拆条片段的特征，所述特征包括图片特征、音频特征；所述处理器还用于，根据第一神经网络模型对所述多个细粒度拆条片段的特征进行处理，以得到所述视频的拆分点预测序列，所述拆分点预测序列包括多个拆分点和所述多个拆分点...

【专利技术属性】
技术研发人员：陈大友，金鑫，涂丹丹，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人