视频向量化方法及装置制造方法及图纸

技术编号：13995421 阅读：101 留言：0更新日期：2016-11-15 01:56

本发明专利技术涉及视频向量化方法及装置。该方法包括：采集目标用户的用户行为数据，并根据所述用户行为数据生成第一视频列表；提取所述第一视频列表中的各个视频的前后视频的特征向量；根据所述各个视频的前后视频的特征向量建立第一视频向量模型；采集视频样本，并通过所述视频样本训练所述第一视频向量模型，得到第二视频向量模型；通过所述第二视频向量模型对所述第一视频列表中的视频进行向量化。根据本发明专利技术的视频向量化方法及装置无需对视频逐帧进行向量化，而是对视频的整体进行向量化，大大降低了视频向量化的数据量及噪声，提高了视频向量化的处理速度，且结合用户行为数据建立视频向量模型，从而使视频向量能够更准备地反映视频信息。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及信息
，尤其涉及一种视频向量化方法及装置。
技术介绍
互联网时代是信息爆炸的时代，信息的数量以指数级增长。在视频领域，视频的数量以井喷式增长。目前，YouTube网站每分钟大约有60个小时的视频被上传，YouTube网站总的视频数量达到了数亿。如何对如此庞大数量的视频进行快速有效的分析和量化成为目前研究的重点。目前，对视频进行向量化处理主要基于卷积神经网络的视频特征提取方法。该方法将视频进行逐帧分析，提取视频的每一帧图像分别进行向量化，具体来说，通过卷积神经网络对每张图像进行多维度的特征提取，再进行向量映射。由于对视频中的每帧图像分别进行向量化，导致视频向量化得到的数据量较大，且图像对应的向量的信息表示不明确，噪声较大。
技术实现思路
技术问题有鉴于此，本专利技术要解决的技术问题是，现有的视频向量化技术得到的数据量较大，且图像对应的向量的信息表示不明确，噪声较大。解决方案为了解决上述技术问题，根据本专利技术的一实施例，提供了一种视频向量化方法，包括：采集目标用户的用户行为数据，并根据所述用户行为数据生成第一视频列表；提取所述第一视频列表中的各个视频的前后视频的特征向量；根据所述各个视频的前后视频的特征向量建立第一视频向量模型；采集视频样本，并通过所述视频样本训练所述第一视频向量模型，得到第二视频向量模型；通过所述第二视频向量模型对所述第一视频列表中的视频进行向量化。对于上述方法，在一种可能的实现方式中，采集目标用户的用户行为数据，根据所述用户行为数据生成第一视频列表，包括：采集指定时间段内的所述目标用户的所有用户行为数据；从所采集的用户行...

【技术保护点】
一种视频向量化方法，其特征在于，包括：采集目标用户的用户行为数据，并根据所述用户行为数据生成第一视频列表；提取所述第一视频列表中的各个视频的前后视频的特征向量；根据所述各个视频的前后视频的特征向量建立第一视频向量模型；采集视频样本，并通过所述视频样本训练所述第一视频向量模型，得到第二视频向量模型；通过所述第二视频向量模型对所述第一视频列表中的视频进行向量化。

【技术特征摘要】
1.一种视频向量化方法，其特征在于，包括：采集目标用户的用户行为数据，并根据所述用户行为数据生成第一视频列表；提取所述第一视频列表中的各个视频的前后视频的特征向量；根据所述各个视频的前后视频的特征向量建立第一视频向量模型；采集视频样本，并通过所述视频样本训练所述第一视频向量模型，得到第二视频向量模型；通过所述第二视频向量模型对所述第一视频列表中的视频进行向量化。2.根据权利要求1所述的方法，其特征在于，采集目标用户的用户行为数据，根据所述用户行为数据生成第一视频列表，包括：采集指定时间段内的所述目标用户的所有用户行为数据；从所采集的用户行为数据中筛选出有效的用户行为数据；按照所述有效的用户行为数据对应的时间对所述有效的用户行为数据进行排序，得到所述第一视频列表。3.根据权利要求1所述的方法，其特征在于，提取所述第一视频列表中的各个视频的前后视频的特征向量，具体用于：采用式1提取所述第一视频列表中的第j个视频vj的前后视频的特征向量f(vj+k)；其中，vj+k表示所述第一视频列表中的第j+k个视频，K表示用于计算所述第j个视频vj对应的特征向量f(vj+k)的前后视频的个数，H(vj+k)表示所述第j+k个视频的初始向量；根据式2计算；4.根据权利要求3所述的方法，其特征在于，根据所述各个视频的前后视频的特征向量建立第一视频向量模型，具体用于：根据式3建立所述第一视频向量模型；E(vj)＝logp(vj|vj+k) 式3；其中，-K＜k＜K，k≠0，p(vj|vj+k)根据式4确定；p(vj|vj+k)＝cosin[H(vj),f(vj+k)] 式4；其中，cosin[H(vj),f(vj+k)]表示H(vj)与f(vj+k)之间的余弦距离。5.根据权利要求1所述的方法，其特征在于，采集视频样本，包括：从区间(0,1)中产生一个随机数；若所述随机数落在区间Ii上，则将所述第一视频列表中的第i-1个视频作为所述视频样本；其中，Ii＝(li-1,li)，i＝1,2...N，l0＝0，i表示观看次数区间，N表示所述观看次数区间的总个数，counter(vj)表示所述第一视频列表中的第j个视频被所有用户观看的总次数，表示所述第一视频列表中的所有视频被所有用户观看的总次数。6.一种视频向量化装置，其特征在于，包括：第一视频列表生成模块，用于采集目标用户的用户...

【专利技术属性】
技术研发人员：刘荣，吴强，赵磊，单明辉，尹玉宗，姚键，潘柏宇，王冀，
申请(专利权)人：合一网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人