一种视频片段的热度预测方法技术

技术编号：22075948 阅读：29 留言：0更新日期：2019-09-12 14:12

本发明专利技术公开了一种视频片段的热度预测方法，用视频编码模块(Video Encoder)进行视频片段的视频编码特征向量提取的方法，从而获取视频的视觉信息，用视频‑语义映射模型LT(Language Transfer)进行视频语义映射特征向量提取的方法，并进行多模态信息融合，从而可以获取更多关于视频内容的信息。这样实现了结合弹幕的语义信息，对视频片段热度的预测，从而将精彩片段推荐给观众，增加观众观看意愿。

A Thermal Prediction Method for Video Fragments

全部详细技术资料下载

【技术实现步骤摘要】
一种视频片段的热度预测方法
本专利技术属于视频信息挖掘
，更为具体地讲，涉及一种视频片段的热度预测方法。
技术介绍
在视频热度预测方面，现有技术中，大多数方法会根据历史视频的各个属性：包括视频发布者、视频长度、视频类型、视频发布时间等具体数据，来判断哪些类别的视频可能收到观众的欢迎，没有通过视频的视觉内容直接去预测一个视频是否会受到观众欢迎，因此，预测往往不准确。并且只能预测某个视频在将来是否会受到观众的欢迎，并不能预测一段视频中哪些片段更受观众欢迎。在弹幕信息挖掘方面，目前大量的工作主要针对弹幕的密集程度，来判断视频中哪个片段正在发生重要的、吸引人的事情，只用到了弹幕的数量信息，没有用到弹幕的语义信息，并用弹幕的语义信息来判断观众的情绪和喜好。现有的视频热度预测主要集中在预测一个视频在未来是否会受到观众的欢迎。然而对一段视频来讲，可能并不会整段视频都很吸引人，但它可能会存在一些比较精彩的片段。如果能够挖掘出视频中哪些片段在未来更能够吸引观众，并将精彩片段推荐给观众，那么观众可能会更愿意去观看这些视频，增加点击量，进而产生巨大的商业价值。
技术实现思路
本专利技术的目的在于克服现有技术的不足，提供一种视频片段的热度预测方法，结合弹幕的语义信息，对视频片段的热度进行预测，从而将精彩片段推荐给观众，增加观众观看意愿。为实现上述专利技术目的，本专利技术视频片段的热度预测方法，其特征在于，包括以下步骤：(1)、构建训练用数据集收集视频及对应的弹幕数据，并根据场景的变化将视频划分为连续的若干片段，将弹幕与每一视频片段对应，以视频片段的弹幕多少进行热度划分，并作为该...

【技术保护点】
1.一种视频片段的热度预测方法，其特征在于，包括以下步骤：(1)、构建训练用数据集收集视频及对应的弹幕数据，并根据场景的变化将视频划分为连续的若干片段，将弹幕与每一视频片段对应，以视频片段的弹幕多少进行热度划分，并作为该视频片段的标签，即判断视频片段是否受到观众欢迎的依据，弹幕多的视频片段，为受观众欢迎的视频片段；对于每一视频的关键帧，提取其帧特征FEA；(2)、构建并训练一视频编码模块VE(Video Encoder)视频编码模型(VE)有两层，分别是段内编码层和段间连接层，两个层均为双向的LSTM(Long Short‑Term Memory，长短期记忆网络)结构；对输入视频，提取关键帧的帧特征FEA送入段内编码层，在段内编码层，每一帧用LSTM单元依次前向、后向连接(编码)，这样可以获得时间维度的细微变化信息；在前向连接中，在每一视频片段的最后一个帧特征编码后，得到的前向信息传递送入段间连接层，在后向连接中，在每一视频片段的最前一个帧特征编码后，得到的反向信息传递送入段间连接层；在段间连接层中，每一视频片段对应有一个前向LSTM单元和一个后向LSTM单元，前向LSTM单元将该视频...

【技术特征摘要】
1.一种视频片段的热度预测方法，其特征在于，包括以下步骤：(1)、构建训练用数据集收集视频及对应的弹幕数据，并根据场景的变化将视频划分为连续的若干片段，将弹幕与每一视频片段对应，以视频片段的弹幕多少进行热度划分，并作为该视频片段的标签，即判断视频片段是否受到观众欢迎的依据，弹幕多的视频片段，为受观众欢迎的视频片段；对于每一视频的关键帧，提取其帧特征FEA；(2)、构建并训练一视频编码模块VE(VideoEncoder)视频编码模型(VE)有两层，分别是段内编码层和段间连接层，两个层均为双向的LSTM(LongShort-TermMemory，长短期记忆网络)结构；对输入视频，提取关键帧的帧特征FEA送入段内编码层，在段内编码层，每一帧用LSTM单元依次前向、后向连接(编码)，这样可以获得时间维度的细微变化信息；在前向连接中，在每一视频片段的最后一个帧特征编码后，得到的前向信息传递送入段间连接层，在后向连接中，在每一视频片段的最前一个帧特征编码后，得到的反向信息传递送入段间连接层；在段间连接层中，每一视频片段对应有一个前向LSTM单元和一个后向LSTM单元，前向LSTM单元将该视频片段前向信息传递与前一视频片段在段间连接层中对应的前向LSTM单元输出的前向特征向量(FEA_FVE)进行连接(编码)，输出前向特征向量(FEA_FVE)；后向LSTM单元将该视频片段后向信息传递与后一视频片段段间连接层中对应的后向LSTM单元输出的后向特征向量(FEA_BVE)进行连接(编码)，输出后向特征向量(FEA_BVE)，以获得视频相邻片段场景变化的信息；对于每个视频片段，将前向特征向量(FEA_FVE)与后向特征向量(FEA_BVE)进行连接，合成一个视频编码特征向量FEA_VE；将视频片段特征向量FEA_VE送入全连接层FC1中进行全连接操作，全连接后输出到Softmax层S1，将视频片段特征向量FEA_VE连接到5类热度，即非常热门、比较热门、一般热门、比较冷门、非常冷门，并用训练用数据集中的视频进行训练：输入视频以及该视频的各个视频片段标签，使用梯度下降法优化视频编码模块；(3)、构建...

【专利技术属性】
技术研发人员：杨阳，汪政，周杰，
申请(专利权)人：成都澳海川科技有限公司，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人