The present invention provides a method and apparatus for recommending video. The method includes: determining the similarity between the 22 video library has a set of tags; based on the similarity to determine the user video on video library of interest; recommended to the user of the interest degree according to the preset mode to select a certain number of video based on.
【技术实现步骤摘要】
一种推荐视频的方法和装置
本专利技术涉及信息处理
,具体而言涉及一种推荐视频的方法和装置。
技术介绍
随着互联网的发展、以及3G和4G移动通信网络的推广和智能终端的普及,大量的应用也应运而生。互联网提供的资讯也越来越丰富,传统的文字配图片的网页资讯已经不能满足用户的需求,新发展起来的业务场景资讯是“短视频”资讯,例如秒拍APP、美拍APP、微视APP等流行的第三方应用可以为用户提供“短视频”的上传和观看等功能。“短视频”资讯主要是给用户展示时长较短且优质的视频内容给用户观看。但是,视频的流量大于文字的流量,在3G和4G的无线网络观看大量的短视频会让用户消耗过多的流量,给用户带来过高的通讯消费。另外,用户也越来越喜欢随手拍摄身边发生的一些事,然后上传网上进行分享,还有业余爱好者拍摄并在网上分享的微电影等等,这些目前可以在以提供视频为主要服务的网站上可以大量浏览,例如优酷网等等。但是,用户想从海量的视频资料库里找到感兴趣的视频,还是需要花费不少时间。因此有必要在向用户展示“短视频”资讯时,向用户推荐其感兴趣的“短视频”资讯;或者在用户登录例如优酷网等浏览其他用户 ...
【技术保护点】
一种推荐视频的方法,其包括:确定视频库里的两两视频的标题之间的第一相似性;基于所述第一相似性来确定用户对视频库里的视频的兴趣度;基于所述兴趣度按预设方式选取一定数量的视频向用户推荐。
【技术特征摘要】
1.一种推荐视频的方法,其包括:确定视频库里的两两视频的标题之间的第一相似性;基于所述第一相似性来确定用户对视频库里的视频的兴趣度;基于所述兴趣度按预设方式选取一定数量的视频向用户推荐。2.根据权利要求1所述的方法,其特征在于在确定视频库里的两两视频的标题之间的第一相似性的步骤中,确定所述第一相似性的方法如下:A)对视频库里的每个视频的标题进行分词处理,得到一个分词集合;B)确定所述分词集合里不同分词的逆向文件频率:其中:L表示分词集合;l表示分词集合L中的任意一个分词;idfl表示分词集合L中的分词l的逆向文件频率;di表示视频库里的视频i的标题的分词集合;|V|表示视频库里的视频总数量;|{i:l∈di}|表示包含分词l的视频数量;C)确定视频库里的每个视频的标题的词频:其中,l表示分词集合L中的任意一个分词;di表示视频库里的视频i的标题的分词集合;tfi,l表示视频i的标题的分词l的词频;ni,l表示分词l在视频i的标题中出现的次数;表示视频i的标题中所有分词的出现次数之和;D)生成视频库里的不同视频的标题的分词的特征向量:对于任意一个视频i,首先计算分词l对于视频i的标题的权重,记为wi,l,计算公式如下:wi,l=tfi,l×idfl设视频i的分词的特征向量为则该特征向量的稀疏表达式为:同理,对于任意一个视频j,首先计算分词l对于视频j的标题的权重,记为wj,l,计算公式如下:wj,l=tfj,l×idfl设视频j的分词的特征向量为则该特征向量的稀疏表达式为:E)计算视频库里的两两视频中的标题的第一相似性:其中:s1i,j表示视频库里的视频i与视频j的标题之间的第一相似性;是视频库里的视频i的分词的特征向量;是视频库里的视频j的分词的特征向量。3.根据权利要求1所述的方法,其特征在于在基于所述第一相似性来确定用户对视频库里的视频的兴趣度的步骤中,确定所述兴趣度的方法如下:其中:|V|表示视频库里的视频总数量;lu,i表示用户u对视频库里的视频i的兴趣度;cu,i表示用户u是否点击过视频i,点击过视频i时取值为1,没有点击过视频i时取值为0;s1i,j表示视频库里的视频i与视频j的标题之间的第一相似性。4.根据权利要求1所述的方法,其特征在于在基于所述兴趣度按预设方式选取一定数量的视频向用户推荐的步骤中,基于所述兴趣度值从大到小顺序选取一定数量的视频向用户推荐,或是从大于或等于预设阈值的兴趣度所对应的视频中随机选取一定数量的视频向用户推荐。5.一种推荐视频的方法,其包括:确定视频库里的两两视频之间的第二相似性;基于所述第二相似性来确定用户对视频库里的视频的兴趣度;基于所述兴趣度按预设方式选取一定数量的视频向用户推荐。6.根据权利要求5所述的方法,其特征在于在确定视频库里的两两视频之间的第二相似性的步骤中,确定所述第二相似性的方法如下:其中:s2i,j表示视频库里的视频i与视频j之间的第二相似性;Ui表示点击视频库里的两两视频中的视频i的用户集合;Uj表示点击视频库里的两两视频中的视频j的用户集合。7.根据权利要求5所述的方法,其特征在于在基于所述第二相似性来确定用户对视频库里的视频的兴趣度的步骤中,确定所述兴趣度的方法如下:其中:|V|表示视频库里的视频总数量;lu,i表示用户u对视频库里的视频i的兴趣度;cu,i表示用户u是否点击过视频i,点击过视频i时取值为1,没有点击过视频i时取值为0;s2i,j表示视频库里的视频i与视频j之间的第二相似性。8.根据权利要求5所述的方法,其特征在于在基于所述兴趣度按预设方式选取一定数量的视频向用户推荐的步骤中,基于所述兴趣度值从大到小顺序选取一定数量的视频向用户推荐,或是从大于或等于预设阈值的兴趣度所对应的视频中随机选取一定数量的视频向用户推荐。9.一种推荐视频的方法,其包括:确定视频库里的两两视频各自所具有的标签集之间的第三相似性;基于所述第三相似性来确定用户对视频库里的视频的兴趣度;基于所述兴趣度按预设方式选取一定数量的视频向用户推荐。10.根据权利要求9所述的方法,其特征在于在确定视频库里的两两视频各自所具有的标签集之间的第三相似性的步骤中,所述确定所述第三相似性的具体方法如下:其中:s3i,j表示视频库里的视频i与视频j各自所具有的标签集之间的第三相似性;Ti表示视频库里的两两视频中的视频i具有的标签集;Tj表示视频库里的两两视频中的视频j具有的标签集。11.根据权利要求9所述的方法,其特征在于在基于所述第三相似性来确定用户对视频库里的视频的兴趣度的步骤中,确定所述兴趣度的方法如下:其中:|V|表示视频库里的视频总数量;lu,i表示用户u对视频库里的视频i的兴趣度;cu,i表示用户u是否点击过视频i,点击过视频i时取值为1,没有点击过视频i时取值为0;s3i,j表示视频库里的视频i与视频j各自所具有的标签集之间的第三相似性。12.根据权利要求9所述的方法,其特征在于在基于所述兴趣度按预设方式选取一定数量的视频向用户推荐的步骤中,基于所述兴趣度值从大到小顺序选取一定数量的视频向用户推荐,或是从大于或等于预设阈值的兴趣度所对应的视频中随机选取一定数量的视频向用户推荐。13.一种推荐视频的方法,其包括:确定视频库里的两两视频的标题之间的第一相似性;确定视频库里的两两视频之间的第二相似性;确定视频库里的两两视频各自所具有的标签集之间的第三相似性;基于获得的所述三个相似性参数确定视频库里的两两视频之间的综合相似性;基于所述综合相似性来确定用户对视频库里的视频的兴趣度;基于所述兴趣度按预设方式选取一定数量的视频向用户推荐。14.根据权利要求...
【专利技术属性】
技术研发人员:潘岸腾,
申请(专利权)人:广州优视网络科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。