视频召回方法及装置制造方法及图纸

技术编号：35403152 阅读：15 留言：0更新日期：2022-11-03 10:54

本发明专利技术提供一种视频召回方法及装置，方法包括：根据目标用户的视频播放记录中的视频ID和视频ID与视频Embedding向量之间的关系，确定目标用户的视频Embedding向量；获取目标用户的用户Embedding向量；根据目标用户的用户Embedding向量和构建的annoy树，确定目标用户的待召回视频。本发明专利技术通过引入annoy树，以构建二叉树的方式来完成对视频Embedding向量间相似度的计算，并结合获取的用户Embedding向量，最终实现用户向量及视频向量间相似度的高效查询，提高了对视频实时推荐召回的速度。提高了对视频实时推荐召回的速度。提高了对视频实时推荐召回的速度。

全部详细技术资料下载

【技术实现步骤摘要】
视频召回方法及装置

[0001]本专利技术涉及视频推荐召回
，尤其涉及一种视频召回方法及装置。

技术介绍

[0002]随着互联网和通信技术的蓬勃发展，视频业务也出现爆发性的增长，如何提高视频推荐的精准度，提升用户的使用体验成为视频推荐所关心的核心问题。当前主流的的视频推荐算法从功能可以分为召回层、粗排层和精排层，召回层的视频数量及视频关联度决定了推荐算法的效果，召回视频量太少，会使得推荐效果不佳，召回数量太大，则会大大加重后续排序层的计算量。
[0003]当前主流的召回方法主要分为4类：一、基于内容的召回，主要是将用户画像与内容画像进行匹配，又分为基于内容标签的匹配和基于知识的匹配；核心是根据内容间的相似度进行召回，这类召回方法较为简单，召回率较高；二、基于协同过滤的召回，主要分为基于用户、基于物品和基于模型的协同过滤，基于协同过滤的召回的核心思想建立用户和内容间的行为矩阵，依据“相似性”进行分发，这种方式准确率较高，而且可以提升用户推荐的扩展性；三、基于FM模型的召回，主要通过特征间的二阶组合来提升推荐的精准度，通过对用户特征和视频特征隐向量的学习，达到更加准确的刻画用户兴趣的效果；四、基于深度学习算法的召回，主要利用深层神经网络的方法对用户兴趣特征进行学习，通过大量的训练帮助捕获用户的特定兴趣并提高推荐的相关性。
[0004]现有技术存在以下缺点：
[0005]1、通过判断内容彼此间的相似度来进行相似内容的召回，这种方法较为刻板，内容较为局限，无法实现用户兴趣的扩展；
[00...

【技术保护点】

【技术特征摘要】
1.一种视频召回方法，其特征在于，包括：根据目标用户的视频播放记录中的视频ID和视频ID与视频Embedding向量之间的关系，确定所述目标用户的视频Embedding向量；获取目标用户的用户Embedding向量；根据所述目标用户的用户Embedding向量和所述目标用户的视频Embedding向量，确定所述目标用户的待召回视频；其中，所述视频ID与视频Embedding向量之间的关系是根据构建的annoy树确定的；所述annoy树是根据标准化后的视频Embedding向量文件构建的。2.根据权利要求1所述的视频召回方法，其特征在于，所述视频ID与视频Embedding向量之间的关系通过如下方式确定：基于LRU缓存算法缓存所述annoy树和树索引与视频ID之间的映射关系；根据所述树索引与视频ID之间的映射关系和所述annoy树中树索引与视频Embedding向量之间的关系，确定所述视频ID与视频Embedding向量之间的关系。3.根据权利要求1所述的视频召回方法，其特征在于，所述标准化后的视频Embedding向量文件通过如下方式确定：根据用户的视频播放记录中的视频ID对应的视频的基本信息，构建数据库；根据所述数据库中用户与视频的交互信息，确定所述视频Embedding向量文件；对所述视频Embedding向量文件进行归一化处理，获取所述标准化后的视频Embedding向量文件；其中，所述视频的基本信息包括视频的标题、标签、分发标题和简介信息。4.根据权利要求3所述的视频召回方法，其特征在于，所述根据用户的视频播放记录中的视频ID对应的视频的基本信息，构建数据库，包括：基于结巴分词包对所述用户的视频播放记录中的视频ID的视频的基本信息进行分词，以过滤包括停用词、数字和符号的无用信息；根据分词后的每个词出现的频率，获取每个词的idf值和tf_idf值；按照所述tf_idf值将所有词进行排序，以构建所述数据库。5.根据权利要求3所述的视频召回方法，其特征在于，所述根据所述数据库中用户与视频的交互信息，确定所述视频Embedding向量文件，包括：从所述数据库中获取用户和视频的交互信息，去除满足第一预设条件的用户，以确定用户
‑
视频交互矩阵；从所述数据库中获取满足第二预设条件的视频的基本信息，并基于结巴分词包对所述视频的基本信息进行分词，以获取满足所述第二预设条件的视频的所有词；对所...

【专利技术属性】
技术研发人员：李展鹏，
申请(专利权)人：中移电子商务有限公司中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人