一种互联网内容推荐方法及系统技术方案

技术编号:24456634 阅读:54 留言:0更新日期:2020-06-10 15:44
本发明专利技术涉及一种互联网内容推荐方法及系统,所述方法包括:从n个已知用户中选取k个作为候选引导者,初始化各所述候选引导者涉及项目类型的权重;对各所述候选引导者涉及项目类型的权重进行训练,以更新各所述候选引导者涉及项目类型的权重,选取更新后的各所述项目类型对应的权重最高的所述候选引导者作为引导者;新用户进行面试时,通过所述新用户选择的项目类型对应的所述引导者对所述新用户进行内容推荐。本发明专利技术通过上述方案在不需要新用户的元数据的基础上解决了推荐系统冷启动的问题。

An Internet content recommendation method and system

【技术实现步骤摘要】
一种互联网内容推荐方法及系统
本专利技术涉及互联网信息领域,特别是涉及一种互联网内容推荐方法及系统。
技术介绍
随着大数据时代的到来,互联网上积累了海量的各种多媒体内容,如文本、图片、音视频等。随着社交网络(如国外的Facebook、Twitter、国内的新浪微博、微信朋友圈等)和支持无线数据接入的设备(智能手机和平板电脑)的快速普及,人们可以随时随地地自由创建、上传和共享各种类型的多媒体内容。这使得已经承载了海量数据的互联网又迎来了数据量的爆发增长;一方面,极度丰富的互联网内容可以满足每位用户的个性化需求;另一方面,海量的互联网数据也使得用户很难快速准确地找到自己感兴趣的信息;作为互联网内容的投放者,也很难让自己的内容从海量数据中脱颖而出,准确投放到目标用户群;这种被称作“信息过载”的问题在当今的互联网时代变得尤为严重。解决信息过载问题的一个非常有潜力的办法是推荐系统;推荐系统是一种帮助用户快速发现有用信息的工具,和搜索引擎不同的是,推荐系统不需要用户提供明确的需求,它是根据用户的信息需求、兴趣等,将用户感兴趣的信息、产品等推本文档来自技高网...

【技术保护点】
1.一种互联网内容推荐方法,其特征在于,包括:/n从n个已知用户中选取k个作为候选引导者,初始化各所述候选引导者涉及项目类型的权重;k和n均为大于1的正整数且k≤n;/n对各所述候选引导者涉及项目类型的权重进行训练,以更新各所述候选引导者涉及项目类型的权重,选取更新后的各所述项目类型对应的权重最高的所述候选引导者作为引导者;/n新用户进行面试时,通过所述新用户选择的项目类型对应的所述引导者对所述新用户进行内容推荐。/n

【技术特征摘要】
1.一种互联网内容推荐方法,其特征在于,包括:
从n个已知用户中选取k个作为候选引导者,初始化各所述候选引导者涉及项目类型的权重;k和n均为大于1的正整数且k≤n;
对各所述候选引导者涉及项目类型的权重进行训练,以更新各所述候选引导者涉及项目类型的权重,选取更新后的各所述项目类型对应的权重最高的所述候选引导者作为引导者;
新用户进行面试时,通过所述新用户选择的项目类型对应的所述引导者对所述新用户进行内容推荐。


2.根据权利要求1所述的一种互联网内容推荐方法,其特征在于,所述从n个已知用户中选取k个作为候选引导者,初始化各所述候选引导者涉及项目类型的权重,包括:
根据n个所述已知用户的历史交互数据建立评级训练模型,如下式:
rij′=u+mi+bj+qjpiT;
式中:rij′表示第i个已知用户第j个项目的预测评级,u表示真实评级的平均值,mi表示第i个已知用户的偏置,bj表示第j个项目类型的偏置,qj表示第j个项目类型的潜在因子,pi表示第i个已知用户的潜在因子,piT表示pi的转置,qjpiT表示qj与piT之间的内积;
采用随机梯度下降法对所述评级训练模型中的参数进行更新,如下式:
mi←mi+α[(rij-rij′)-β*mi];
bj←bj+α[(rij-rij′)-β*bj];
qj←qj+α[(rij-rij′)*piT-β*qj];
pi←pi+α[(rij-rij′)*qj-β*pi];
式中:α和β均为超参数,rij表示第i个已知用户第j个项目的真实评级;
根据参数更新后的所述评级训练模型得到各所述已知用户涉及的项目类型的预测评级,根据所述预测评级和所述真实评级得到各所述已知用户涉及项目类型的均方根误差,根据各所述已知用户涉及项目类型的数量和所述均方根误差选取k个已知用户作为候选引导者;
初始化各所述候选引导者涉及的项目类型的权重。


3.根据权利要求2所述的一种互联网内容推荐方法,其特征在于,所述对各所述候选引导者涉及项目类型的权重进行训练,以更新各所述候选引导者涉及项目类型的权重,选取更新后的各所述项目类型对应的权重最高的所述候选引导者作为引导者,包括:
按照设定比例对除了所述候选引导者之外的所述已知用户进行随机分组,得到两组用户集,选取两组用户集中比例系数高的一组作为训练用户集;
令所述训练用户集中的训练用户随机选取设定数量的所述项目类型;
建立权重训练模型,如下式:
Wyj←Wyj+(a-func(ejy,ejl′));
式中:Wyj表示第y个候选引导者第j个项目类型的权重,a表示已知用户的均方根误差的和,ejy表示第y个候选引导者第j个项目类型的真实评级,ejl′表示第l个训练用户第j个项目类型的预测评级,func(ejy,ejl′)=∑(ejy-ejl′)/|Sy|,Sy表示第y个候选引导者涉及项目类型的评级的集合,|Sy|表示Sy的元素数量;
根据所述权重训练模型得到更新后的各所述候选引导者涉及项目类型的权重;
通过更新后的权重选取各所述项目类型对应的权重最高的所述候选引导者作为引导者。


4.根据权利要求1所述的一种互联网内容推荐方法,其特征在于,所述新用户进行面试时,通过所述新用户选择的项目类型对应的所述引导者对所述新用户进行内容推荐,包括:
对新用户进行面试,以选取项目类型;
所述引导者根据新用户选择的项目类型生成内容推荐列表;
根据设定条件对所述内容推荐列表中的内容进行判断,若符合要求,则推荐给所述新用户,若不符合要求,则舍弃。


5.根据权利要求4所述的一种互联网内容推荐方法,其特征在于,所述设定条件包括:
一是所述引导者在所述内容推荐列表中的内容对应的项目类型上的真实评级高于设定分数阈值;
二是所述内容推荐列表中的内容对应的项目类型的评级次数大于所述已知用户的数量的设定百分比。


6.一种...

【专利技术属性】
技术研发人员:张剑飞杨洪伟徐超
申请(专利权)人:长春理工大学
类型:发明
国别省市:吉林;22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1