本发明专利技术涉及一种视频推荐方法和装置,所述方法包括:获取视频,所述视频包括长视频和短视频;获取所述长视频中视频属性值大于相应属性阈值的长视频;获取用户的观看记录,获取所述短视频与所述观看记录中的视频之间的相似度,提取所述相似度最高的预设个短视频;向用户推荐所述长视频中视频属性值大于相应属性阈值的长视频,和/或向用户推荐所述相似度最高的预设个短视频。本发明专利技术提高了视频推荐的准确度。
【技术实现步骤摘要】
本专利技术涉及网络数据处理
,特别是涉及一种视频推荐方法和装置。
技术介绍
随着网络技术的发展,通过视频网站观看网络视频已经成为人们娱乐和学习的一种主流方式。为了帮助用户从百万计的网络视频中寻找自己喜欢的视频,各个视频网站都会通过各种呈现方式向用户进行视频推荐。对于视频推荐,一般会用到视频标签(如电影的主演,导演,演员,简介等)和用户标的观看记录。传统的视频推荐方法中,一般通过用户的历史观看记录分析出用户的兴趣,并给用户做出视频推荐。或者,给用户推荐与历史观看记录中具有相同视频标签的其他视频,比如用户看过《两杆大烟枪》,则会向用户推荐盖里奇的其他作品。视频根据视频时长可以分为长视频和短视频。然而,用户选择长视频和短视频的标准存在一定的差异,传统的视频推荐方法不会针对长视频和短视频分别进行处理再推荐,使得推荐的准确度不够高。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能提高视频推荐的准确度的视频推荐方法和装置。一种视频推荐方法,所述方法包括:获取视频,所述视频包括长视频和短视频;获取所述长视频中视频属性值大于相应属性阈值的长视频;获取用户的观看记录,获取所述短视频与所述观看记录中的视频之间的相似度,提取所述相似度最高的预设个短视频;向用户推荐所述长视频中视频属性值大于相应属性阈值的长视频,和/或向用户推荐所述相似度最高的预设个短视频。一种视频推荐装置,所述装置包括:第一获取模块,用于获取视频,所述视频包括长视频和短视频;第二获取模块,用于获取所述长视频中视频属性值大于相应属性阈值的长视频;第三获取模块,用于获取用户的观看记录及所述短视频与所述观看记录中的视频之间的相似度,提取所述相似度最高的预设个短视频;推荐模块,向用户推荐所述长视频中视频属性值大于相应属性阈值的长视频,和/或向用户推荐所述相似度最高的预设个短视频。上述视频推荐方法和装置,考虑到用户从网络视频中寻找长视频和寻找短视频的标准不一样,通过获取长视频中视频属性值大于相应属性阈值的长视频、获取用户的观看记录和获取所述短视频与所述观看记录中的视频之间的相似度,提取所述相似度最高的预设个短视频,向用户推荐所述长视频中视频属性值大于相应属性阈值的长视频,和/或向用户推荐所述相似度最高的预设个短视频,针对长视频和短视频的不同特征采用不同的推荐标准,提高了推荐的准确度。附图说明图1为一个实施例中视频推荐方法实现的应用环境图;图2为一个实施例中服务器的内部结构示意图;图3为一个实施例中视频推荐方法的流程示意图;图4为另一个实施例中视频推荐方法的部分流程图;图5为一个实施例中获取短视频与观看记录中的视频之间的相似度,提取相似度最高的预设个短视频的具体流程图;图6为一个具体应用场景中视频推荐方法的用户终端界面图;图7为一个具体应用场景中实现视频推荐过程的架构图;图8为一个实施例中视频推荐装置的结构框图;图9为另一个实施例中视频推荐装置的部分结构框图;图10为一个实施例中第三获取模块的结构框图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。如图1所示,为一个实施例中视频推荐方法实现的应用环境图,该应用环境包括用户终端102和服务器104。其中,用户终端102可以是手机、个人笔记本、平板电脑或者台式计算机等任何安装有视频应用的终端;服务器104可以是一个或多个服务器。用户终端102和服务器104之间通过网络进行通信。在一个实施例中,上述图1中的服务器104的内部结构示意图如图2所示。该服务器104包括通过系统总线连接的处理器、内存储器、非易失性存储介质、网络接口和输出设备。其中,该服务器的存储介质存储有操作系统和一种视频推荐装置,该视频推荐装置用于实现一种视频推荐方法。该服务器104的处理器被配置为执行一种视频推荐方法,用于提供计算和控制能力,支撑整个服务器104的运行,该服务器104的内存储器为存储介质中的视频推荐装置的运行提供环境,该服务器104的网络接口用于与用户终端102进行网络通信。该输出设备包括显示屏。如图3所示,在一个实施例中,提供了一种视频推荐方法,本实施例以该方法应用于上述图1中的服务器来举例说明。该视频推荐方法具体包括如下步骤:步骤S302:获取视频。具体地,服务器可以从网络视频的数据源获取视频。数据源是提供所需要数据的器件或原始媒体。在数据源中存储了所有建立数据库连接的信息。就像通过指定文件名称可以在文件系统中找到文件一样,通过提供正确的数据源名称,可以找到相应的数据库连接以获取视频。每个视频都有相应的视频信息,如视频时长、视频标题等。视频时长是指正常情况下播完一个视频所花费的时间。视频根据视频时长可以分为长视频和短视频。视频时长可以是几秒钟,也可以是几个小时。预先设置一个时长分界点(如45分钟),像电视剧、卡通、电影等视频时长大于等于45分钟的视频为长视频,而广告、新闻等视频时长小于45分钟的视频为短视频。考虑到用户在选择长视频和短视频的标准不同,将视频分为长视频和短视频进行处理以更好地满足用户的需求。视频标题可以是包括名词、动词等不同词性的词语串。进一步地,视频信息还包括专辑标识、视频标识、视频类型、视频子类型等。其中,专辑标识和视频标识为一串包含字母和数字的字符串,如专辑标识可以为r0154jba1kd,视频标识可以为3tvgfggkrubwssx等。视频类型一般采用数字表示,如1表示电影、2表示电视、3表示卡通、9表示记录、10表示表演视频等。步骤S304:获取长视频中视频属性值大于相应属性阈值的长视频。具体地,视频属性值一般包括视频点击量、观看次数及观看完成率等。其中,视频点击量是指该视频被点击的次数的总和,观看次数是指该视频被点击播放的时间超过预设时长(比如20分钟)的次数的总和,观看完成率是指将该视频每次的观看完成率相加再除以视频点击量而得到的平均值。其中,该视频每次的观看完成率等于每次的观看的时长除以视频时长。举例说明,天天向上的第20150619期的视频标题为“风云毕业生上演戛纳花被单秀”,视频时长为80分钟。假设该视频被点击了10000次,其中有5000次被点击播放的时间为80分钟(超过预设时长),有5000次被点击播放的时间为1分钟(未超过预设时长),那么该视频的点击量为10000次,观看次数为5000次,观看完成率为0.50625。通过设置相应的属性阈值以获取所述长视频中视频属性值大于相应属性阈值的长视频。步骤S306:获取用户的观看记录,获取短视频与观看记录中的视频之间的相似度,提取相似度最高的预设个短视频。具体地,用户通过用户终端进入视频应用时,可以以游客的身份或会员的身份观看视频,其中游客是指没有登录的用户,而会员则是登录的用户。用户通过用户终端进入视频应用时,服务器可以获取到对应的观看记录。如果用户为会员,服务器则会获取与会员的帐号对应的观看记录,如果用户为游客,服务器则会获取与游客使用的用户终端的IP地址对应的观看记录。用户的观看记录是指该用户已经观看过的视频所对应的视频信息。举例说明,如果用户标识对应的A用户观本文档来自技高网...

【技术保护点】
一种视频推荐方法,所述方法包括:获取视频,所述视频包括长视频和短视频;获取所述长视频中视频属性值大于相应属性阈值的长视频;获取用户的观看记录,获取所述短视频与所述观看记录中的视频之间的相似度,提取所述相似度最高的预设个短视频;向用户推荐所述长视频中视频属性值大于相应属性阈值的长视频,和/或向用户推荐所述相似度最高的预设个短视频。
【技术特征摘要】
1.一种视频推荐方法,所述方法包括:获取视频,所述视频包括长视频和短视频;获取所述长视频中视频属性值大于相应属性阈值的长视频;获取用户的观看记录,获取所述短视频与所述观看记录中的视频之间的相似度,提取所述相似度最高的预设个短视频;向用户推荐所述长视频中视频属性值大于相应属性阈值的长视频,和/或向用户推荐所述相似度最高的预设个短视频。2.根据权利要求1所述的方法,其特征在于,所述视频属性值包括观看次数和观看完成率,所述获取所述长视频中视频属性值大于相应属性阈值的长视频的步骤,包括:按照预先设置的优先级数据获取预设时间内更新的长视频中观看次数大于次数阈值的视频和/或获取预设时间内更新的长视频中观看完成率大于完成率阈值的视频。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:检测所述预设时间内更新的长视频中是否有曝光次数达到曝光阈值的视频或者是否有出现在所述观看记录中的视频;若是,将所述曝光次数达到曝光阈值的视频或出现在所述观看记录中的视频进行过滤。4.根据权利要求1所述的方法,其特征在于,所述获取所述短视频与所述观看记录中的视频之间的相似度,提取所述相似度最高的预设个短视频的步骤,包括:对观看记录中最近观看的短视频的视频标题进行分词以得到单独的词;将所述单独的词分别作为关键字在预先建立的视频倒排索引表中进行查询以获取对应的视频标识所构成的视频集合;计算视频集合中每个短视频的视频标题与观看记录中最近观看的短视频的视频标题的相似度;提取所述相似度最高的预设个短视频。5.根据权利要求4所述的方法,其特征在于,所述计算视频集合中每个短视频的视频标题与观看记录中最近观看的短视频的视频标题的相似度的步骤,包括:获取所述视频集合中每个短视频的视频标题与观看记录中最近观看的短视频的视频标题的相同的词,并将相同的词的权值中最大的权...
【专利技术属性】
技术研发人员:谢怡然,张文郁,徐钊,向宇,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。