用户画像向量生成方法及装置制造方法及图纸

技术编号:21605723 阅读:21 留言:0更新日期:2019-07-13 18:17
公开了一种用户画像向量生成方法及装置。所述方法包括:根据用户的视频点击历史,获取该用户观看过的视频信息;根据获取的所述视频信息,查找与视频对应的视频描述向量,其中所述视频描述向量是通过对视频所含图像进行分析而生成的;以及基于查找出的视频描述向量,生成用户画像向量。由此,通过将视频的图像内容描述向量化,基于用户的观看历史构建用户图像向量,从而能够根据用户的观看行为本身快速实现对用户画像的描述。进一步地,用户画像向量可以根据观看历史的累积而以不同方式被实时更新,从而使得用户画像的描述更为准确、生成和更新的过程更为轻量。

Method and Device for Generating User Portrait Vector

【技术实现步骤摘要】
用户画像向量生成方法及装置
本专利技术涉及推荐系统,尤其涉及一种用户画像向量生成方法及装置。
技术介绍
视频行业近年来发展迅猛,其中短视频尤以其社交性而大行其道,并且出现在一大批以分发个人状况短视频为主的短视频社交应用,这类应用主要以短视频消费为主社交为辅进行体系的构建。为了提高用户友好度并减少低效的后台计算,这些应用需要将合适的视频内容在合适的时间以合适的方式推荐给合适的用户。内容合适是指内容契合目标用户口味,时间合适是指推荐内容应景当时的上下文,方式合适是指推荐的内容展现方式让用户感到舒适,用户合适是指推荐的用户确实对被推荐内容有较强的认可度。为此,进行高效推荐的一个前提是理解用户,这就需要创建用户画像来对用户进行表述。在现有技术中,主要基于人口属性和行为特征来构建用户画像。但现有的用户画像构建方法需要消耗大量的人力和物力,并且在上述行为数据和其他背景数据不足的情况下无法进行准确描述。为此,需要一种更为轻量且高效的用户画像生成方案。
技术实现思路
有鉴于此,本专利技术提出了一种用户画像向量生成方法及装置,其通过将视频的图像内容描述向量化,来基于用户的观看历史构建用户图像向量,从而能够根据用户的观看行为本身快速实现对用户画像的描述。进一步地,用户画像向量可以根据观看历史的累积而以不同方式被实时更新,从而使得用户画像的描述更为准确、生成和更新的过程更为轻量。根据本专利技术的一个方面,提出了一种用户画像向量生成方法,包括:根据用户的视频点击历史,获取该用户观看过的视频信息;根据获取的所述视频信息,查找与视频对应的视频描述向量,其中所述视频描述向量是通过对视频所含图像进行分析而生成的;以及基于查找出的视频描述向量,生成用户画像向量。由此,通过视频描述的向量化实现用户画像的向量化,从而方便用户画像的生成并提升与视频推荐的计算相关性。优选地,所述视频的视频描述向量是该视频的关键帧向量,其中,生成关键帧向量包括:提取视频的关键帧;使用人工神经网络(ANN)分类器对每个所述关键帧进行分类;基于分类结果构造视频的关键帧向量。ANN分类器优选可以是经训练的CNN分类器,例如GoogleInception模型。由此,可以借助成熟且高准确度的现有ANN模型对视频关键帧进行内容分类和向量构造,并基于向量的易于计算和客观性提升用户画像描述的准确性。优选地,基于分类结果构造视频的关键帧向量包括:将分类类别作为向量维度,分类所属概率值作为向量分类值,构造每个视频各自的关键帧向量。优选地,所述关键帧向量基于如下的至少一项被简化:选取每个分类结果中分类所属概率值最大的前N个分类构造该视频的关键帧向量,其中,N是预定的正整数;选取每个分类结果中分类所属概率值大于预定阈值的分类构造该视频的关键帧向量;以及对每个分类所属概率值进行小数点后第M位的舍入,以构造每个视频各自的关键帧向量,其中,M是预定的正整数。由此确保对描述视频的向量的客观构造和计算可实现性。优选地,基于查找出的视频描述向量,生成用户画像向量可以包括合并生成和/或聚类生成。合并生成包括:两两计算多个视频描述向量之间的相似度;以及合并相似的两个或多个视频描述向量作为至少一个用户画像向量。聚类生成则包括:基于多个视频描述向量的相似度对多个视频描述向量进行聚类;以及求取聚类中心作为至少一个所述用户画像向量。由此提升画像生成的灵活性。优选地,在针对同一用户得到两个或以上用户画像向量的情况下,可以为每个用户画像向量分配与其合并或聚类的视频描述向量个数相关联的权重值。由此,进一步提升用户画像向量对用户行为的描述。优选地,可以为上述合并和聚类添加各类约束条件,包括但不限于:被合并或聚类的两个或多个视频描述向量的相似度需要大于预定相似度阈值;以及针对同一用户生成的用户画像向量不大于预定的个数阈值和/或满足与观看过的视频个数的预定约束条件等等。优选地,本专利技术的方法还可以还包括:根据动态更新的视频点击历史,实时或近实时地求取所述用户画像向量。例如,可以根据获取的视频信息的数量和/或视频描述向量的分布状况,动态选择直接使用、合并或是聚类所述视频描述向量作为所述用户画像向量的操作。根据本专利技术的再一个方面,提出了一种用户画像向量生成装置,包括:观看信息获取单元,用于根据用户的视频点击历史获取该用户观看过的视频信息;视频描述向量查找单元,用于根据获取的所述视频信息查找与视频对应的视频描述向量,其中所述视频描述向量是通过对视频所含图像进行分析而生成的;以及用户画像向量求取单元,用于基于查找出的视频描述向量,生成用户画像向量。优选地,该装置还可以包括:关键帧向量生成单元,用于生成视频的关键帧向量作为该视频的视频描述向量,所述关键帧向量生成单元进一步用于:提取视频的关键帧;使用人工神经网络(ANN)分类器对每个所述关键帧进行分类;基于分类结果构造视频的关键帧向量。优选地,所述关键帧向量生成单元基于分类结果构造视频的关键帧向量包括:将分类类别作为向量维度,分类所属概率值作为向量分类值,构造每个视频各自的关键帧向量。优选地,所述关键帧向量生成单元基于如下的至少一项简化所述关键帧向量:选取每个分类结果中分类所属概率值最大的前N个分类构造该视频的关键帧向量,其中,N是预定的正整数;选取每个分类结果中分类所属概率值大于预定阈值的分类构造该视频的关键帧向量;以及对每个分类所属概率值进行小数点后第M位的舍入,以构造每个视频各自的关键帧向量,其中,M是预定的正整数。优选地,所述用户画像向量求取单元包括合并单元和/或聚类单元,其中,所述合并单元用于:两两计算多个视频描述向量之间的相似度;以及合并相似的两个或多个视频描述向量作为至少一个用户画像向量,所述聚类单元用于:基于多个视频描述向量的相似度对多个视频描述向量进行聚类;以及求取聚类中心作为至少一个所述用户画像向量。优选地,在所述用户画像向量求取单元针对同一用户得到两个或以上用户画像向量的情况下,为每个用户画像向量分配与其合并或聚类的视频描述向量个数相关联的权重值,其中,被合并或聚类的两个或多个视频描述向量的相似度大于预定相似度阈值,并且针对同一用户生成的用户画像向量不大于预定的个数阈值和/或满足与观看过的视频个数的预定约束条件。优选地,所述用户画像向量求取单元进一步用于:根据动态更新的视频点击历史,实时或近实时地求取所述用户画像向量,例如,可以根据获取的视频信息的数量和/或视频描述向量的分布状况,动态选择直接使用、合并或是聚类所述视频描述向量作为所述用户画像向量的操作。根据本专利技术的再一个方面,提出了一种计算设备,包括:处理器;以及存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的用户画像向量生成方法。根据本专利技术的又一个方面,提出了一种非暂时性机器可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上所述的用户画像向量生成方法。本方面通过将视频描述向量化,进而将用户图像向量化而提出一种更轻量、高效的用户画像生成方案,该方案能够解决构建用户画像生成需要大量数据及大量人力的问题,利用向量易于计算的特征使用用户的实时消费行为数据实时构建用户画像,而无需考虑用户视频观看行为及用户规模的大小,生成的用户画本文档来自技高网...

【技术保护点】
1.一种用户画像向量生成方法,包括:根据用户的视频点击历史,获取该用户观看过的视频信息;根据获取的所述视频信息,查找与视频对应的视频描述向量,其中所述视频描述向量是通过对视频所含图像进行分析而生成的;以及基于查找出的视频描述向量,生成用户画像向量。

【技术特征摘要】
1.一种用户画像向量生成方法,包括:根据用户的视频点击历史,获取该用户观看过的视频信息;根据获取的所述视频信息,查找与视频对应的视频描述向量,其中所述视频描述向量是通过对视频所含图像进行分析而生成的;以及基于查找出的视频描述向量,生成用户画像向量。2.如权利要求1所述的方法,其中,所述视频的视频描述向量是该视频的关键帧向量,其中,生成关键帧向量包括:提取视频的关键帧;使用人工神经网络(ANN)分类器对每个所述关键帧进行分类;基于分类结果构造视频的关键帧向量。3.如权利要求2所述的方法,其中,基于分类结果构造视频的关键帧向量包括:将分类类别作为向量维度,分类所属概率值作为向量分类值,构造每个视频各自的关键帧向量。4.如权利要求3所述的方法,其中,所述关键帧向量根据如下至少一项被简化:选取每个分类结果中分类所属概率值最大的前N个分类构造该视频的关键帧向量,其中,N是预定的正整数;选取每个分类结果中分类所属概率值大于预定阈值的分类构造该视频的关键帧向量;以及对每个分类所属概率值进行小数点后第M位的舍入,以构造每个视频各自的关键帧向量,其中,M是预定的正整数。5.如权利要求1所述的方法,其中,基于查找出的视频描述向量,生成用户画像向量包括:两两计算多个视频描述向量之间的相似度;以及合并相似的两个或多个视频描述向量作为至少一个用户画像向量,和/或基于多个视频描述向量的相似度对多个视频描述向量进行聚类;以及求取聚类中心作为至少一个所述用户画像向量。6.如权利要求5所述的方法,其中,在针对同一用户得到两个或以上用户画像向量的情况下,为每个用户画像向量分配与其合并或聚类的视频描述向量个数相关联的权重值。7.如权利要求5所述的方法,其中,被合并或聚类的两个或多个视频描述向量的相似度大于预定相似度阈值。8.如权利要求5所述的方法,其中,针对同一用户生成的用户画像向量不大于预定的个数阈值和/或满足与观看过的视频个数的预定约束条件。9.如权利要求1所述的方法,还包括:根据动态更新的视频点击历史,实时或近实时地求取所述用户画像向量。10.如权利要求9所述的方法,其中,根据动态更新的视频点击历史,实时或近实时地求取所述用户画像向量包括:根据获取的视频信息的数量和/或视频描述向量的分布状况,动态选择直接使用、合并或是聚类所述视频描述向量作为所述用户画像向量的操作。11.一种用户画像向量生成装置,包括:观看信息获取单元,用于根据用户的视频点击历史获取该用户观看过的视频信息;视频描述向量查找单元,用于根据获取的所述视频信息查找与视频对应的视频描述向量,其中所述视频描述向量是通过对视频所含图像进行分析而生成的;...

【专利技术属性】
技术研发人员:邹红才郑海洪潘春球
申请(专利权)人:广州新视展投资咨询有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1