个性化视频推荐系统及方法技术方案

技术编号:8754566 阅读:489 留言:0更新日期:2013-06-05 19:49
本发明专利技术公开一种个性化视频推荐系统及方法,该系统包括:视频资料库;点击行为记录模块,获取各用户的点击行为,并针对各用户分别将被点击的视频的标识记录于数据库表中;兴趣模型建立模块,从该数据库表中获取每个视频的属性信息,并根据该属性信息提取用户的兴趣标记,建立兴趣模型;候选视频生成模块,根据一相关视频生成规则从视频资料库中生成一候选视频列表;以及视频推荐模块,对该候选视频列表中的每条候选视频根据一权值计算模型进行权值计算,并根据每条候选视频的权值计算结果排序生成推荐列表,输出推荐结果,本发明专利技术可根据每个用户的个人兴趣,挖掘出符合个性化需求的内容进行推荐。

【技术实现步骤摘要】

本专利技术涉及一种视频推荐系统及方法,特别是涉及一种个性化视频推荐系统及方法。
技术介绍
由于电脑的高度普及、互联网快速与无远弗届的特性,互联网的使用者呈大幅增长,形成了数量惊人的消费族群,互联网的需求与使用在现代科技化社会中已成为不可或缺的部分,使得许多产业看好互联网所隐含的庞大商机,例如,各种类型的电子商务、线上游戏、网络金融交易、语言学习以及在线视频等。时至今日,许多网页内容正逐渐摆脱互联网的束缚,朝向多元化、更广泛的应用环境发展,大多数的网站会在网站会在网站首页显示所提供服务的页面链接,当使用者访问网站时,便可看到提供服务页面链接的网站首页,但是目前常见的网站的页面是配置固定不变的页面,比如视频网站,当使用者想要寻找某一视频链接时,常常必须在密密麻麻的页面费心寻找才有办法进行链接观看视频;另一方面,由于每个用户的兴趣点往往是不相同的,固定的网站页面无法突显用户的兴趣点,不便用户使用。综上所述,可知先前技术之视频网站存在网站页面固定不变、不便用户使用的问题,因此实有必要提出改进的技术手段,来解决此一问题。
技术实现思路
为克服上述现有技术存在的不足,本专利技术的主要目的在于提供一种个性化视频推荐系统及方法,其能自动记录并学习用户的浏览行为,从中挖掘用户的兴趣点,并根据每个用户的个人兴趣,挖掘出符合个性化需求的内容。为达上述及其它目的,本专利技术提供一种个性化视频推荐系统,至少包括:视频资料库;点击行为记录模块,获取各用户的点击行为,并针对各用户分别将被点击的视频的标识记录于数据库表中;兴趣模型建立模块,从该数据库表中获取每个视频的属性信息,并根据该属性信息提取用户的兴趣标记,建立兴趣模型;候选视频生成模块,根据一相关视频生成规则从视频资料库中生成一候选视频列表;以及视频推荐模块,对该候选视频列表中的每条候选视频根据一权值计算模型进行权值计算,并根据每条候选视频的权值计算结果排序生成推荐列表,输出推荐结果。进一步地,该属性信息包括关键字、标签及类别信息。进一步地,该兴趣模型建立模组从该数据表中获取每个视频的标题关键字、标签、类别信息,进行合并和统计次数,并按频率由高到低排列,取前k个出现频率最高的词汇,构成对应用户的兴趣标记。进一步地,该相关视频生成规则包含:针对该数据表中的每个视频标识,于该视频资料库中查询与其相似的前S1条视频标识;根据该兴趣模型中的兴趣标记,于该视频资料库中查询所有相关的视频标识,并取每个兴趣标记对应的最新的前S2条视频;以及于该视频资料库中挑取当前最热门的前S3条视频标识。进一步地,该候选视频列表为S1、S2、S3的部分或所有组合。进一步地,该权值计算模型为:new_weight=origin_weight*repeat_ratio*time_ratio其中new_weight为每条候选视频的最终权值,origin_weight为每条候选视频原始权值,repeat_ratio为重复因数,time_ratio为时间因数。进一步地,该原始权值origin_weight为:origin_weight=playcount_hour+playcount_total*0.002,其中,playcount_hour表示过去1小时中当前视频被点击的数量,playcount_total表示当前视频从生成至今总的点击数量;该重复因数repeat_ratio为:repeat_ratio=1.0+0.1*(N-1),其中N为重复出现的次数;该时间因数time_ratio:当前页面为非播放页时,time_ratio=1.0-0.02*(T-1),当前页面为播放页时,当T=1时,time_ratio=1.2,1<T<=20时,time_ratio=1.0-0.02*(T-1),其中T表示从最近视频开始,往前倒推的个数。进一步地,该个性化视频推荐系统还包括一过滤模块,依据该视频推荐模块的排序结果与该数据表进行比对,若某个候选视频的视频标识在该数据表中出现,则将其从该推荐列表中删除。进一步地,该数据表以队列方式存储。为达上述及其他目的,本专利技术提供一种个性化视频推荐方法,包括如下步骤:获取点击行为,并根据每一用户分别将被点击的视频的标识记录于一数据库表中;获取该数据库表中每个视频的属性信息,提取用户的兴趣标记,构建用户兴趣模型;根据一相关视频生成规则从一视频资料库中生成候选视频列表;以及对每条候选视频根据一权值计算模型进行权值计算,并根据每条候选视频的权值计算结果排序生成推荐列表,输出推荐结果。进一步地,该构建用户兴趣模型的步骤为:从该数据表中获取每个视频的标题关键字、标签、类别信息,进行合并和统计次数,并按频率由高到低排列,取前k个出现频率最高的词汇,构成对应用户的兴趣标记,构建用户兴趣模型。进一步地,该相关视频生成规则包含:针对该数据表中的每个视频标识,于该视频资料库中查询与其相似的前S1条视频标识;根据该兴趣模型中的兴趣标记,于该视频资料库中查询所有相关的视频标识,并取每个兴趣标记对应的最新的前S2条视频;以及于该视频资料库中挑取当前最热门的前S3条视频vid,这里最热门的前S3条视频标识。进一步地,该权值计算模型为:new_weight=origin_weight*repeat_ratio*time_ratio其中new_weight为每条候选视频的最终权值,origin_weight为每条候选视频原始权值,repeat_ratio为重复因数,time_ratio为时间因数。进一步地,该原始权值origin_weight为:origin_weight=playcount_hour+playcount_total*0.002,其中,playcount_hour表示过去1小时中当前视频被点击的数量,playcount_total表示当前视频从生成至今总的点击数量;该重复因数repeat_ratio为:repeat_ratio=1.0+0.1*(N-1),其中N为重复出现的次数;该时间因数time_ratio:当前页面为非播放页时,time_ratio=1.0-0.02*(T-1),当前页面为播放页时,当T=1时,time_ratio=1.2,1<T<=20时,time_ratio=1.0-0.02*(T-1),其中T表示从最近视频开始,往前倒推的个数。进一步地,于该权值计算步骤中,本文档来自技高网...

【技术保护点】
一种个性化视频推荐系统,至少包括:视频资料库;点击行为记录模块,获取各用户的点击行为,并针对各用户分别将被点击的视频的标识记录于数据库表中;兴趣模型建立模块,从该数据库表中获取每个视频的属性信息,并根据该属性信息提取用户的兴趣标记,建立兴趣模型;候选视频生成模块,根据一相关视频生成规则从视频资料库中生成一候选视频列表;以及视频推荐模块,对该候选视频列表中的每条候选视频根据一权值计算模型进行权值计算,并根据每条候选视频的权值计算结果排序生成推荐列表,输出推荐结果。

【技术特征摘要】
1.一种个性化视频推荐系统,至少包括:
视频资料库;
点击行为记录模块,获取各用户的点击行为,并针对各用户分别将被点击
的视频的标识记录于数据库表中;
兴趣模型建立模块,从该数据库表中获取每个视频的属性信息,并根据该
属性信息提取用户的兴趣标记,建立兴趣模型;
候选视频生成模块,根据一相关视频生成规则从视频资料库中生成一候选
视频列表;以及
视频推荐模块,对该候选视频列表中的每条候选视频根据一权值计算模型
进行权值计算,并根据每条候选视频的权值计算结果排序生成推荐列表,输出
推荐结果。
2.如权利要求1所述的个性化视频推荐系统,其特征在于:该属性信息
包括关键字、标签及类别信息。
3.如权利要求2所述的个性化视频推荐系统,其特征在于:该兴趣模型
建立模组从该数据表中获取每个视频的标题关键字、标签、类别信息,进行合
并和统计次数,并按频率由高到低排列,取前k个出现频率最高的词汇,构成
对应用户的兴趣标记。
4.如权利要求1所述的个性化视频推荐系统,其特征在于,该相关视频
生成规则包含:
针对该数据表中的每个视频标识,于该视频资料库中查询与其相似的前S1
条视频标识;
根据该兴趣模型中的兴趣标记,于该视频资料库中查询所有相关的视频标

\t识,并取每个兴趣标记对应的最新的前S2条视频;以及
于该视频资料库中挑取当前最热门的前S3条视频标识。
5.如权利要求4所述的个性化视频推荐系统,其特征在于:该候选视频
列表为S1、S2、S3的部分或所有组合。
6.如权利要求1所述的个性化视频推荐系统,其特征在于:该权值计算
模型为:
new_weight=origin_weight*repeat_ratio*time_ratio
其中new_weight为每条候选视频的最终权值,origin_weight为每条候选视
频原始权值,repeat_ratio为重复因数,time_ratio为时间因数。
7.如权利要求6所述的个性化视频推荐系统,其特征在于,该原始权值
origin_weight为:origin_weight=playcount_hour+playcount_total*0.002,其中,
playcount_hour表示过去1小时中当前视频被点击的数量,playcount_total表示
当前视频从生成至今总的点击数量;该重复因数repeat_ratio为:repeat_ratio=
1.0+0.1*(N-1),其中N为重复出现的次数;该时间因数time_ratio:当前页面为
非播放页时,time_ratio=1.0-0.02*(T-1),当前页面为播放页时,当T=1时,
time_ratio=1.2,1<T<=20时,time_ratio=1.0-0.02*(T-1),其中T表示从最
近视频开始,往前倒推的个数。
8.如权利要求1所述的个性化视频推荐系统,其特征在于:该个性化视频
推荐系统还包括一过滤模块,依据该视频推荐模块的排序结果与该数据表进行

【专利技术属性】
技术研发人员:陈运文吕晴刘作涛
申请(专利权)人:盛乐信息技术上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1