推荐视频召回方法和装置制造方法及图纸

技术编号:21605721 阅读:64 留言:0更新日期:2019-07-13 18:17
公开了一种基于向量的推荐视频召回方法和装置。所述方法包括:基于用户的当前视频点击历史,查找与每个视频对应的视频描述向量;根据查找到的多个视频描述向量,生成该用户的至少一个当前用户画像向量;以及召回视频描述向量与所述至少一个当前用户画像向量相似的候选推荐视频。通过将视频和用户画像的描述向量化,本发明专利技术可以在缺乏用户画像的基础上快速、高效的实现个性化推荐,并能够方便地基于用户视频观看历史构建用户画像向量,并基于向量化的用户画像轻松召回具有类似向量的推荐视频。

Recommended Video Recall Method and Device

【技术实现步骤摘要】
推荐视频召回方法和装置
本专利技术涉及推荐系统,尤其涉及一种基于向量的推荐视频召回方法和装置。
技术介绍
视频行业近年来发展迅猛,其中短视频尤以其社交性而大行其道,并且出现在一大批以分发个人状况短视频为主的短视频社交应用,这类应用主要以短视频消费为主社交为辅进行体系的构建。为了提高用户友好度并减少低效的后台计算,这些应用需要将合适的视频内容在合适的时间以合适的方式推荐给合适的用户。内容合适是指内容契合目标用户口味,时间合适是指推荐内容应景当时的上下文,方式合适是指推荐的内容展现方式让用户感到舒适,用户合适是指推荐的用户确实对被推荐内容有较强的认可度。为此,进行高效推荐的前提是理解用户和视频内容,这就需要创建用户画像来对用户进行表述并对视频内容加以分类或是进行标注。在现有技术中,各类推荐召回方法都是根据用户画像离线为每个用户计算出各个召回拉链,之后把这些召回拉链存于缓存中,在推荐时根据用户画像与推荐上下文拉取不同的召回拉链作为召回。这种召回方式需要存储每个用户的多条召回拉链,通常每个召回拉链长度都在千级别且在离线计算召回拉链时并不知道用户在接下来的推荐周期内是否会进行应用访问,所以通常需要计算90天或60天的所有活跃用户。对于中大型用户规模的应用而言,如上操作所需的存储资源非常可观,但有效利用率却不高。另外,此种召回方式需要耗费巨大人力物力进行用户画像构造,且在平台上线初期难以实现。为此,需要一种更为轻量且高效的推荐视频召回方案。
技术实现思路
有鉴于此,本专利技术提出了一种基于向量的视频召回算法,可以在缺乏用户画像的基础上快速、高效的实现个性化推荐。通过将视频和用户画像的描述向量化,能够方便地基于用户视频观看历史构建用户画像向量,并基于向量化的用户画像轻松召回具有类似向量的推荐视频。根据本专利技术的一个方面,提出了一种推荐视频召回方法,包括:基于用户的当前视频点击历史,查找与每个视频对应的视频描述向量;根据查找到的多个视频描述向量,生成该用户的至少一个当前用户画像向量;以及召回视频描述向量与所述至少一个当前用户画像向量相似的候选推荐视频。由此,通过将视频和用户画像的描述向量化,能够方便地基于用户视频观看历史构建用户画像向量,并基于向量化的用户画像轻松召回具有类似向量的推荐视频。优选地,召回视频描述向量与所述至少一个当前用户画像向量相似的候选推荐视频包括:基于多个当前用户画像向量中的每一个召回一条候选推荐视频拉链;以及融合多条候选推荐视频拉链作为所述用户的当前相似推荐视频,例如,基于当前用户画像向量的权重,确定相似推荐视频中各条候选推荐视频拉链的占比和/或呈现方式,其中,每个当前用户画像向量的权重基于如下至少一项确定:生成该当前用户画像向量的视频描述向量的个数;生成该当前用户画像向量的视频描述向量对应视频的观看时间。由此,能够基于不同的用户偏好,获取相应的推荐视频。优选地,本专利技术的召回方法还可以包括:针对多个已有视频,计算每个已有视频的视频描述向量;以及构造视频ID到其对应视频描述向量的视频向量对应表。于是,可以基于用户当前视频点击历史中包含的视频ID,从所述视频向量对应表中查找对应的视频描述向量。优选地,本专利技术的召回方法还可以包括:对多个已有视频的视频描述向量进行聚类;以及构造视频ID到其所属聚类ID的视频聚类对应表。于是,召回操作可以包括:计算每个当前用户画像向量所属的聚类;基于每个所属的聚类从所述视频聚类对应表中找出每个聚类所包含的视频ID;基于所包含的视频ID从所述视频向量对应表中找出对应的视频描述向量;计算每个当前用户画像与其所属聚类内各视频的视频描述向量的相似性;以及返回相似度最高的预定数目的视频ID作为该当前用户画像向量所召回的候选推荐视频拉链。由此,使得平台只需存储两个对应表,就可以基于用户的视频历史数据,方便地进行实时用户画像的生成和推荐视频的召回。优选地,本专利技术的召回方法还可以包括:基于新增视频在各个聚类中分布的疏密程度,进行现有聚类的合并或分解的聚类更新操作;以及根据聚类更新操作的结果更新所述视频聚类对应表。由此,使得聚类能够更为及时准确的反映所属视频的内容,并提升后续召回操作的计算效率和准确性。可以在如下至少一种场合下实时生成用户的当前用户画像向量并召回相应的候选推荐视频:在用户开启视频应用的情况下;在用户新点击了预定个数的视频的情况下;以及在预定的时间间隔下。由此,基于具体应用场景和系统性能,极大地提升推荐的实时性和灵活性。优选地,每个视频对应的视频描述向量是从人工神经网络(ANN)对该视频的关键帧进行分类的分类结果构造而来的关键帧向量,并且用户的当前用户画像向量是从该用户观看的视频的关键帧向量的合并和/或聚类而生成的。由此,可以利用成熟ANN(例如,CNN图像分类模型)的特征提取功能,构造出准确反映图像内容的关键帧向量,并为后续的合并和推荐操作的准确性提供基础。根据本专利技术的另一个方面,提出了一种推荐视频召回装置,包括:视频描述向量查找单元,用于基于用户的当前视频点击历史,查找与每个视频对应的视频描述向量;用户画像向量生成单元,用于根据查找到的多个视频描述向量,生成该用户的至少一个当前用户画像向量;以及候选推荐视频召回单元,用于召回视频描述向量与所述至少一个当前用户画像向量相似的候选推荐视频。优选地,所述候选推荐视频召回单元可以用于:基于多个当前用户画像向量中的每一个召回一条候选推荐视频拉链;以及融合多条候选推荐视频拉链作为所述用户的当前相似推荐视频。优选地,所述候选推荐视频召回单元的融合操作可以包括:基于当前用户画像向量的权重,确定相似推荐视频中各条候选推荐视频拉链的占比和/或呈现方式,其中,每个当前用户画像向量的权重基于如下至少一项确定:生成该当前用户画像向量的视频描述向量的个数;以及生成该当前用户画像向量的视频描述向量对应视频的观看时间。优选地,召回装置还可以包括:视频描述向量生成单元和聚类计算单元,其中,视频描述向量生成单元用于:针对多个已有视频,计算每个已有视频的视频描述向量;以及构造视频ID到其对应视频描述向量的视频向量对应表,所述聚类计算单元用于:对多个已有视频的视频描述向量进行聚类;以及构造视频ID到其所属聚类ID的视频聚类对应表。优选地,视频描述向量查找单元可以用于:基于用户当前视频点击历史中包含的视频ID,从所述视频向量对应表中查找对应的视频描述向量,并且所述候选推荐视频召回单元用于:计算每个当前用户画像向量所属的聚类;基于每个所属的聚类从所述视频聚类对应表中找出每个聚类所包含的视频ID;基于所包含的视频ID从所述视频向量对应表中找出对应的视频描述向量;计算每个当前用户画像与其所属聚类内各视频的视频描述向量的相似性;以及返回相似度最高的预定数目的视频ID作为该当前用户画像向量所召回的候选推荐视频拉链。优选地,所述聚类计算单元还可以用于:基于新增视频在各个聚类中分布的疏密程度,进行现有聚类的合并或分解的聚类更新操作;以及根据聚类更新操作的结果更新所述视频聚类对应表。优选地,所述视频描述向量生成单元从人工神经网络(ANN)对某一视频的关键帧进行分类的分类结果构造关键帧向量作为该视频的视频描述向量,并且所述用户画像向量生成单元对某一用户观看的视频的关键帧向量进行合并本文档来自技高网...

【技术保护点】
1.一种推荐视频召回方法,包括:基于用户的当前视频点击历史,查找与每个视频对应的视频描述向量;根据查找到的多个视频描述向量,生成该用户的至少一个当前用户画像向量;以及召回视频描述向量与所述至少一个当前用户画像向量相似的候选推荐视频。

【技术特征摘要】
1.一种推荐视频召回方法,包括:基于用户的当前视频点击历史,查找与每个视频对应的视频描述向量;根据查找到的多个视频描述向量,生成该用户的至少一个当前用户画像向量;以及召回视频描述向量与所述至少一个当前用户画像向量相似的候选推荐视频。2.如权利要求1所述的方法,其中,召回视频描述向量与所述至少一个当前用户画像向量相似的候选推荐视频包括:基于多个当前用户画像向量中的每一个召回一条候选推荐视频拉链;以及融合多条候选推荐视频拉链作为所述用户的当前相似推荐视频。3.如权利要求2所述的方法,其中,融合多条候选推荐视频拉链作为所述用户的当前相似推荐视频包括:基于当前用户画像向量的权重,确定相似推荐视频中各条候选推荐视频拉链的占比和/或呈现方式,其中,每个当前用户画像向量的权重基于如下至少一项确定:生成该当前用户画像向量的视频描述向量的个数;生成该当前用户画像向量的视频描述向量对应视频的观看时间。4.如权利要求1所述的方法,还包括:针对多个已有视频,计算每个已有视频的视频描述向量;以及构造视频ID到其对应视频描述向量的视频向量对应表。5.如权利要求4所述的方法,其中,基于用户的当前视频点击历史,查找与每个视频对应的视频描述向量包括:基于用户当前视频点击历史中包含的视频ID,从所述视频向量对应表中查找对应的视频描述向量。6.如权利要求4所述的方法,还包括:对多个已有视频的视频描述向量进行聚类;以及构造视频ID到其所属聚类ID的视频聚类对应表。7.如权利要求6所述的方法,其中,召回视频描述向量与所述至少一个当前用户画像向量相似的候选推荐视频包括:计算每个当前用户画像向量所属的聚类;基于每个所属的聚类从所述视频聚类对应表中找出每个聚类所包含的视频ID;基于所包含的视频ID从所述视频向量对应表中找出对应的视频描述向量;计算每个当前用户画像与其所属聚类内各视频的视频描述向量的相似性;以及返回相似度最高的预定数目的视频ID作为该当前用户画像向量所召回的候选推荐视频拉链。8.如权利要求6所述的方法,还包括:基于新增视频在各个聚类中分布的疏密程度,进行现有聚类的合并或分解的聚类更新操作;以及根据聚类更新操作的结果更新所述视频聚类对应表。9.如权利要求1所述的方法,其中,在如下至少一种场合下实时生成用户的当前用户画像向量并召回相应的候选推荐视频:在用户开启视频应用的情况下;在用户新点击了预定个数的视频的情况下;以及在预定的时间间隔下。10.如权利要求1所述的方法,其中,每个视频对应的视频描述向量是从人工神经网络(ANN)对该视频的关键帧进行分类的分类结果构造而来的关键帧向量,并且用户的当前用户画像向量是从该用户观看的视频的关键帧向量的合并和/或聚类而生成的。11.一种推荐视频召回装置,包括:视频描述向量查找单元,用于基于用户的当前视频点击历史,查找与每个视频对应的视频描述向量;用户画像向量生成单元,用于根据查找到的多个视频描述向量,生成该用户...

【专利技术属性】
技术研发人员:邹红才郑海洪翟光亚
申请(专利权)人:广州新视展投资咨询有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1