当前位置: 首页 > 专利查询>广州大学专利>正文

基于中粒度用户分组的资源推荐方法及装置制造方法及图纸

技术编号:15691102 阅读:79 留言:0更新日期:2017-06-24 04:02
本发明专利技术公开了一种基于中粒度用户分组的资源推荐方法及装置。所述基于中粒度用户分组的资源推荐方法包括:采集N个用户的在线或/和离线资源使用数据;根据每个所述资源使用数据及每个所述用户的相关属性获得每个所述用户的影响力;根据每个所述影响力,将所述N个用户中的K个用户分别设置为K个分组的标准用户,并将所述N个用户中的其余N‑K个用户设置为待分组用户;根据每个所述资源使用数据,获得每个所述待分组用户与每个所述标准用户之间的关注主题相似度;根据每个所述关注主题相似度对所述待分组用户进行分组;向每个所述分组中的每个用户推荐其所在分组中的标准用户的推荐资源。采用本发明专利技术,能够提高向用户推荐资源的准确度和速度。

Resource recommendation method and device based on middle granularity user grouping

The invention discloses a resource recommendation method and a device based on a middle granularity user packet. The size of the resource recommendation method based on user grouping includes: acquisition of N users online and offline / or resource usage data; according to the relevant attributes of the user data and each use of each of the resources for each of the user's influence; according to each of the influence, the user N the K users are set to K to a standard user, and the user N in the rest of the N K user set for group users; according to each of the resource usage data, focus on the theme of each of the obtained similarity between users and groups each of the users according to the standard; each of the attention on the topic similarity grouping user grouping; the user recommended resources recommendation in the packet to each user for each of the group in the. The invention can improve the accuracy and speed of recommending resources to the user.

【技术实现步骤摘要】
基于中粒度用户分组的资源推荐方法及装置
本专利技术涉及计算机
,尤其涉及一种基于中粒度用户分组的资源推荐方法及装置。
技术介绍
随着信息技术和互联网的飞速发展,电子商务、在线教育学习、电子政务、及时通信、网络新闻等等在线商务、学习、通信以及公共事务已经成为了我们日常生活的一部分。根据《2016年第38次中国互联网络发展状况统计报告》显示,中国网民有大约6亿用户使用网络新闻以获取信息,有大约4.5亿用户进行网络购物,在新型网络服务中,中国网上外卖和在线教育的用户规模已经达到2亿。根据WeAreSocial的最新报告,2016年,全球互联网用户数量相比去年增长了10%,拥有达到超过34亿的用户规模。社交媒体使用同样增长了10%,而通过移动设备访问社交媒体的人数增长了17%。巨大的用户规模,伴随而来的是如洪水般爆发的互联网信息和资源,包括购物网站、在线社交网络、视频网站、网上新闻等等应用,我们已经进入一个信息过载的时代。在这样一个时代,用户遇到了前所未有的挑战,即如何获取适合自己的信息,爆炸式的资源和信息极大地降低了它们的利用率。从用户的角度来看,信息过载问题使得他们无法有效地满足自己的资源和信息需求;站在应用提供商的角度,如何从海量信息中选取出最适合的一部分给用户成为困扰他们的问题。个性化推荐系统则是解决这一挑战的重要利器。它通过挖掘分析用户的属性和兴趣偏好信息,从而能高效地找到用户感兴趣的资源和信息,以实现个性化推荐。因此,个性化推荐系统受到研究者和企业的广泛关注。推荐系统是解决新时代信息获取和数据关联问题的一个强有力的工具,它可以根据用户的特征和需求,将用户所感兴趣的产品或信息主动推送给用户。相比搜索引擎被动地搜索相关信息,推荐系统更加地主动和智能,能够针对用户挖掘获得与之相符的价值信息。近些年,推荐系统已经成功运用到了电影、音乐和商品等领域的推荐上,并取得了实际的收益。例如,运用于电影推荐的NetFlix,运用于音乐推荐的豆瓣,以及运用于商品推荐的淘宝、京东和Amazon等。推荐系统所创造的价值吸引了越来越多的公司开发自己的推荐引擎,同时使得推荐系统成为了工业界和学术界的研究热点。该项专利技术技术能够使得用户与海量数据信息进行更加合适的关联。从用户的角度看,他们能够更加省时省力地发现有价值的信息;从数据信息生产者角度看,他们能够将自己所生产的数据信息准确快速地送至消费群体,从而使得用户与生产者双方共赢。而在实际推荐系统运行过程中,如何对用户进行分类一直是系统中的核心问题。如果粒度过细会使得算法复杂度过高,使分析变成不可能完成的任务;同时如果粒度太大,对资源推荐的后续工作帮助太小,所以把握好用户特征的颗粒度大小非常重要。
技术实现思路
本专利技术提出一种基于中粒度用户分组的资源推荐方法及装置,提供一种采用了中粒度用户分类技术的推荐方法,能够提高向用户推荐资源的准确度和速度。本专利技术提供的一种基于中粒度用户分组的资源推荐方法,具体包括:采集N个用户的资源使用数据;其中,所述资源使用数据包括在线使用数据和离线使用数据;N>1;根据每个所述资源使用数据,获得每个所述用户的影响力;根据每个所述影响力,将所述N个用户中的K个用户分别设置为K个分组的标准用户,并将所述N个用户中的其余N-K个用户设置为待分组用户;其中,0<K≤N;根据每个所述资源使用数据,获得每个所述待分组用户与每个所述标准用户之间的关注主题相似度;将每个所述待分组用户分别分入与其之间的所述关注主题相似度最高的标准用户所对应的分组;向每个所述分组中的每个用户推荐其所在分组中的标准用户的推荐资源。进一步地,每个所述资源使用数据包括在线使用数据I1,I2,I3,…,In以及离线使用数据I';其中,I1,I2,I3,…,In为从n个在线网络中采集获得的使用数据;则所述根据每个所述资源使用数据,获得每个所述用户的影响力,具体包括:将每个所述资源使用数据分别代入公式I=I1*w1+I2*w2+I3*w3+…+In*wn+I'*w',计算获得相应的所示影响力I;其中,w1,w2,w3,…,wn,w'为各使用数据的权重。进一步地,所述根据每个所述资源使用数据,获得每个所述待分组用户与每个所述标准用户之间的关注主题相似度,具体包括:根据每个所述资源使用数据,采用主题模型分析法计算获得每个所述用户的关注主题分布数据;分别将每个所述待分组用户的所述关注主题分布数据与每个所述标准用户的所述关注主题分布数据进行比较,计算获得相应的所述关注主题相似度。进一步地,所述K个用户为所述N个用户中所述影响力排名前K的用户。进一步地,所述资源使用数据中包括资源描述数据及用户描述数据;其中,所述用户描述数据中包括对应的用户的关注主题数据。相应地,本专利技术还提供了一种基于中粒度用户分组的资源推荐装置,具体包括:资源使用数据获得模块,用于采集N个用户的资源使用数据;其中,所述资源使用数据包括在线使用数据和离线使用数据;N>1;用户影响力获得模块,用于根据每个所述资源使用数据,获得每个所述用户的影响力;用户身份设置模块,用于根据每个所述影响力,将所述N个用户中的K个用户分别设置为K个分组的标准用户,并将所述N个用户中的其余N-K个用户设置为待分组用户;其中,0<K≤N;关注主题相似度获得模块,用于根据每个所述资源使用数据,获得每个所述待分组用户与每个所述标准用户之间的关注主题相似度;用户分组模块,用于将每个所述待分组用户分别分入与其之间的所述关注主题相似度最高的标准用户所对应的分组;以及,资源推荐模块,用于向每个所述分组中的每个用户推荐其所在分组中的标准用户的推荐资源。进一步地,每个所述资源使用数据包括在线使用数据I1,I2,I3,…,In以及离线使用数据I';其中,I1,I2,I3,…,In为从n个在线网络中采集获得的使用数据;则所述用户影响力获得模块,具体包括:影响力计算获得单元,用于将每个所述资源使用数据分别代入公式I=I1*w1+I2*w2+I3*w3+…+In*wn+I'*w',计算获得相应的所示影响力I;其中,w1,w2,w3,…,wn,w'为各使用数据的权重。进一步地,所述关注主题相似度获得模块,具体包括:关注主题分布数据获得单元,用于根据每个所述资源使用数据,采用主题模型分析法计算获得每个所述用户的关注主题分布数据;以及,主题相似度计算获得单元,用于分别将每个所述待分组用户的所述关注主题分布数据与每个所述标准用户的所述关注主题分布数据进行比较,计算获得相应的所述关注主题相似度。进一步地,所述K个用户为所述N个用户中所述影响力排名前K的用户。进一步地,所述资源使用数据中包括资源描述数据及用户描述数据;其中,所述用户描述数据中包括对应的用户的关注主题数据。实施本专利技术,具有如下有益效果:本专利技术提供的基于中粒度用户分组的资源推荐方法及装置,通过从网络中获取用户在线或/和离线的资源使用数据,获得用户的影响力和用户的关注主题,并根据用户的影响力和用户的关注主题对用户进行分组,从而可以获得粒度适中的用户分组,使得推荐过程的运算数据量降低,但同时能够保证推荐所依据的样本数据量充足,为后续的推荐过程奠定基础,提高向用户推荐资源的准确度和速度。附图说明图1是本专利技术提供的基于中粒度用户分组的资源本文档来自技高网
...
基于中粒度用户分组的资源推荐方法及装置

【技术保护点】
一种基于中粒度用户分组的资源推荐方法,其特征在于,包括:采集N个用户的资源使用数据;其中,所述资源使用数据包括在线使用数据和离线使用数据;N>1;根据每个所述资源使用数据,获得每个所述用户的影响力;根据每个所述影响力,将所述N个用户中的K个用户分别设置为K个分组的标准用户,并将所述N个用户中的其余N‑K个用户设置为待分组用户;其中,0<K≤N;根据每个所述资源使用数据,获得每个所述待分组用户与每个所述标准用户之间的关注主题相似度;将每个所述待分组用户分别分入与其之间的所述关注主题相似度最高的标准用户所对应的分组;向每个所述分组中的每个用户推荐其所在分组中的标准用户的推荐资源。

【技术特征摘要】
1.一种基于中粒度用户分组的资源推荐方法,其特征在于,包括:采集N个用户的资源使用数据;其中,所述资源使用数据包括在线使用数据和离线使用数据;N>1;根据每个所述资源使用数据,获得每个所述用户的影响力;根据每个所述影响力,将所述N个用户中的K个用户分别设置为K个分组的标准用户,并将所述N个用户中的其余N-K个用户设置为待分组用户;其中,0<K≤N;根据每个所述资源使用数据,获得每个所述待分组用户与每个所述标准用户之间的关注主题相似度;将每个所述待分组用户分别分入与其之间的所述关注主题相似度最高的标准用户所对应的分组;向每个所述分组中的每个用户推荐其所在分组中的标准用户的推荐资源。2.如权利要求1所述的基于中粒度用户分组的资源推荐方法,其特征在于,每个所述资源使用数据包括在线使用数据I1,I2,I3,…,In以及离线使用数据I';其中,I1,I2,I3,…,In为从n个在线网络中采集获得的使用数据;则所述根据每个所述资源使用数据,获得每个所述用户的影响力,具体包括:将每个所述资源使用数据分别代入公式I=I1*w1+I2*w2+I3*w3+…+In*wn+I'*w',计算获得相应的所示影响力I;其中,w1,w2,w3,…,wn,w'为各使用数据的权重。3.如权利要求1所述的基于中粒度用户分组的资源推荐方法,其特征在于,所述根据每个所述资源使用数据,获得每个所述待分组用户与每个所述标准用户之间的关注主题相似度,具体包括:根据每个所述资源使用数据,采用主题模型分析法计算获得每个所述用户的关注主题分布数据;分别将每个所述待分组用户的所述关注主题分布数据与每个所述标准用户的所述关注主题分布数据进行比较,计算获得相应的所述关注主题相似度。4.如权利要求1至3中任一项所述的基于中粒度用户分组的资源推荐方法,其特征在于,所述K个用户为所述N个用户中所述影响力排名前K的用户。5.如权利要求1至3中任一项所述的基于中粒度用户分组的资源推荐方法,其特征在于,所述资源使用数据中包括资源描述数据及用户描述数据;其中,所述用户描述数据中包括对应的用户的关注主题数据。6.一种基于中粒度用户分组的资源推荐装置,其特征在于,包括:资源使用...

【专利技术属性】
技术研发人员:王国军王峰邢萧飞谢冬青
申请(专利权)人:广州大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1