一种提取视频预览的方法、装置、设备和计算机存储介质制造方法及图纸

技术编号:17884422 阅读:46 留言:0更新日期:2018-05-06 04:51
本发明专利技术提供了一种提取视频预览的方法、装置、设备和计算机存储介质,其中方法包括:将视频输入预先训练得到的视频分类模型;获取所述视频分类模型中注意力模块输出的各视频帧的权重;提取总权重值满足预设要求的连续N个视频帧作为所述视频的视频预览,所述N为预设的正整数。本发明专利技术提供的方式能够从视频中自动提取出连续的视频帧作为视频预览,无需人工剪辑,降低了人工成本。

A method, device, device and computer storage medium for extracting video preview

The invention provides a method, a device, a device and a computer storage medium for extracting a video preview. The method includes: a video classification model which is pre trained by the video input; the weight of each video frame output from the attention module in the video classification model is obtained; and the total weight value is extracted to meet the presupposition requirements. N video frames are used as preview of the video, and the N is a preset positive integer. The method provided by the invention can automatically extract continuous video frames from video as video preview without manual editing, thereby reducing labor cost.

【技术实现步骤摘要】
一种提取视频预览的方法、装置、设备和计算机存储介质
本专利技术涉及计算机应用
,特别涉及一种提取视频预览的方法、装置、设备和计算机存储介质。
技术介绍
互联网信息传递媒介现已由文字、图片发展到视频时代。特别是短视频行业近几年发展迅速,造成了视频资源井喷式提升。目前,用户对视频内容的甄选浏览主要依赖视频标题和封面图片,而静态的视频标题和封面图片对视频内容的表达能力有限,用户可能因标题和封面图片的阐述不够全面而错过其需要的视频资源,或者,对视频内容进行观看后,发现对视频内容的满意度不符合预期,从而浪费用户时间和网络资源。现有技术中,若用户希望获取视频更直观的信息,可以在网络中搜索该视频的视频预览。然而由于现有视频预览往往是人工剪辑形成的,成本较高,通常只有大制作类的电视剧或电影类视频有视频预览,其他类型的视频往往不存在视频预览。
技术实现思路
有鉴于此,本专利技术提供了一种提取视频预览的方法、装置、设备和计算机存储介质,以便于实现视频预览的自动提取,降低人工成本。具体技术方案如下:本专利技术提供了一种提取视频预览的方法,该方法包括:将视频输入预先训练得到的视频分类模型;获取所述视频分类模型中注意力模块输出的各视频帧的权重;提取总权重值满足预设要求的连续N个视频帧作为所述视频的视频预览,所述N为预设的正整数。根据本专利技术一具体实施方式,所述视频分类模型包括:卷积神经网络、时序性神经网络、注意力模块和全连接层。根据本专利技术一具体实施方式,所述预设要求包括:总权重值最大;或者,大于或等于预设权重阈值。根据本专利技术一具体实施方式,所述视频分类模型的训练过程包括:将预先标记视频类别的视频作为训练数据;将训练数据中的视频作为所述视频分类模型的输入,对应的视频类别作为所述视频分类模型的输出,训练所述视频分类模型,以最小化分类结果的损失函数。根据本专利技术一具体实施方式,在所述视频分类模型的训练过程中,将训练数据中的视频作为卷积神经网络的输入,以输出视频中各帧的卷积特征;将各帧的卷积特征作为时序性神经网络的输入,以输出各帧的时序特征;将各帧的时序特征作为注意力模块的输入,以输出各帧的权重;依据各帧的权重和时序性神经网络的输出,在全连接层映射至视频类型;利用映射结果计算损失函数。根据本专利技术一具体实施方式,所述时序性神经网络包括:长短时记忆机LSTM、循环神经网络RNN或门控循环单元GRU。根据本专利技术一具体实施方式,该方法还包括:若在页面上定位到目标视频,则展示所述目标视频的视频预览。根据本专利技术一具体实施方式,所述定位到目标视频包括:定位视频feed页面中处于目标位置的视频;或者,定位视频聚合页面中处于目标位置的视频。根据本专利技术一具体实施方式,展示所述目标视频的视频预览包括:定位到目标视频后,自动播放所述目标视频的视频预览;或者,检测到用户触发播放视频预览的事件后,播放所述目标视频的视频预览。根据本专利技术一具体实施方式,在播放所述目标视频的视频预览的过程中,展示正在播放视频预览的提示信息。根据本专利技术一具体实施方式,该方法还包括:检测到用户触发播放所述目标视频的事件后,播放所述目标视频。本专利技术还提供了一种提取视频预览的装置,该装置包括:输入单元,用于将视频输入预先训练得到的视频分类模型;获取单元,用于获取所述视频分类模型中注意力模块输出的各视频帧的权重;提取单元,用于提取总权重值满足预设要求的连续N个视频帧作为所述视频的视频预览,所述N为预设的正整数。根据本专利技术一具体实施方式,该装置还包括:训练单元,用于训练所述视频分类模型,具体执行:将预先标记视频类别的视频作为训练数据;将训练数据中的视频作为所述视频分类模型的输入,对应的视频类别作为所述视频分类模型的输出,训练所述视频分类模型,以最小化分类结果的损失函数。根据本专利技术一具体实施方式,所述训练单元在所述视频分类模型的训练过程中,将训练数据中的视频作为卷积神经网络的输入,以输出视频中各帧的卷积特征;将各帧的卷积特征作为时序性神经网络的输入,以输出各帧的时序特征;将各帧的时序特征作为注意力模块的输入,以输出各帧的权重;依据各帧的权重和时序性神经网络的输出,在全连接层映射至视频类型;利用映射结果计算损失函数。根据本专利技术一具体实施方式,该装置还包括:定位单元,用于在页面上定位目标视频;第一展示单元,用于展示所述目标视频的视频预览。根据本专利技术一具体实施方式,所述定位单元,具体执行:定位视频feed页面中处于目标位置的视频;或者,定位视频聚合页面中处于目标位置的视频。根据本专利技术一具体实施方式,所述第一展示单元在展示所述目标视频的视频预览时,具体执行:定位到目标视频后,自动播放所述目标视频的视频预览;或者,检测到用户触发播放视频预览的事件后,播放所述目标视频的视频预览。根据本专利技术一具体实施方式,该装置还包括:第二展示单元,用于检测到用户触发播放所述目标视频的事件后,播放所述目标视频。本专利技术还提供了一种设备,所述设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述的方法。本专利技术还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行上述的方法。由以上技术方案可以看出,本专利技术提供的方式能够从视频中自动提取出连续的视频帧作为视频预览,无需人工剪辑,降低了人工成本。【附图说明】图1为本专利技术实施例一提供的从视频中提取视频预览的方法流程图;图2a为本专利技术实施例一提供的视频分类模型的结构示意图;图2b为本专利技术实施例一提供的滑动窗口的示意图;图3为本专利技术实施例一提供的展示视频的方法流程图;图4a和图4b为本专利技术实施例一提供的两种视频feed页面的示意图;图5a和图5b为本专利技术实施例一提供的展示视频预览的两种示意图;图6为本专利技术实施例提供的装置结构图;图7示出了适于用来实现本专利技术实施方式的示例性计算机系统/服务器的框图。【具体实施方式】为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本专利技术进行详细描述。在本专利技术实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本专利技术。在本专利技术实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。实施例一、图1为本专利技术实施例提供的从视频中提取视频预览的方法流程图,如图1所示,该方法可以包括以下步骤:在101中,将视频输入预先训练得到的视频分类模型。本专利技术中涉及的视频分类模型是实现对视频进行分类的模型,即输入视频至视频分类模型,即可输本文档来自技高网...
一种提取视频预览的方法、装置、设备和计算机存储介质

【技术保护点】
一种提取视频预览的方法,其特征在于,该方法包括:将视频输入预先训练得到的视频分类模型;获取所述视频分类模型中注意力模块输出的各视频帧的权重;提取总权重值满足预设要求的连续N个视频帧作为所述视频的视频预览,所述N为预设的正整数。

【技术特征摘要】
1.一种提取视频预览的方法,其特征在于,该方法包括:将视频输入预先训练得到的视频分类模型;获取所述视频分类模型中注意力模块输出的各视频帧的权重;提取总权重值满足预设要求的连续N个视频帧作为所述视频的视频预览,所述N为预设的正整数。2.根据权利要求1所述的方法,其特征在于,所述视频分类模型包括:卷积神经网络、时序性神经网络、注意力模块和全连接层。3.根据权利要求1所述的方法,其特征在于,所述预设要求包括:总权重值最大;或者,大于或等于预设权重阈值。4.根据权利要求1所述的方法,其特征在于,所述视频分类模型的训练过程包括:将预先标记视频类别的视频作为训练数据;将训练数据中的视频作为所述视频分类模型的输入,对应的视频类别作为所述视频分类模型的输出,训练所述视频分类模型,以最小化分类结果的损失函数。5.根据权利要求4所述的方法,其特征在于,在所述视频分类模型的训练过程中,将训练数据中的视频作为卷积神经网络的输入,以输出视频中各帧的卷积特征;将各帧的卷积特征作为时序性神经网络的输入,以输出各帧的时序特征;将各帧的时序特征作为注意力模块的输入,以输出各帧的权重;依据各帧的权重和时序性神经网络的输出,在全连接层映射至视频类型;利用映射结果计算损失函数。6.根据权利要求2或5所述的方法,其特征在于,所述时序性神经网络包括:长短时记忆机LSTM、循环神经网络RNN或门控循环单元GRU。7.根据权利要求1所述的方法,其特征在于,该方法还包括:若在页面上定位到目标视频,则展示所述目标视频的视频预览。8.根据权利要求7所述的方法,其特征在于,所述定位到目标视频包括:定位视频feed页面中处于目标位置的视频;或者,定位视频聚合页面中处于目标位置的视频。9.根据权利要求7所述的方法,其特征在于,展示所述目标视频的视频预览包括:定位到目标视频后,自动播放所述目标视频的视频预览;或者,检测到用户触发播放视频预览的事件后,播放所述目标视频的视频预览。10.根据权利要求9所述的方法,其特征在于,在播放所述目标视频的视频预览的过程中,展示正在播放视频预览的提示信息。11.根据权利要求7所述的方法,其特征在于,该方法还包括:检测到用户触发播放所述目标视频的事件后,播放所述目标视频。12.一种提取视频预览...

【专利技术属性】
技术研发人员:于新卫曾茜李甫文石磊姜佳岐张鑫李峰张宝玉齐萌宫礼星韩蓉蓉宋岳阳孟凡天王海平刘霄孙昊李旭斌常程浩
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1