一种基于标签与图的网页推荐方法、终端设备及存储介质技术

技术编号:27417801 阅读:41 留言:0更新日期:2021-02-21 14:34
本发明专利技术涉及一种基于标签与图的网页推荐方法、终端设备及存储介质,该方法中包括:S1:对所有的用户信息进行分析,提取所有用户对应的所有兴趣标签与权重;S2:通过爬虫系统采集新的网页,并计算每个网页与每个兴趣标签的关联关系和权重;S3:采用基于图的推荐算法,计算出每个用户的待推荐网页列表,并进行展示。本发明专利技术由用户的主动参与变为被动参与,在用户正常的日常操作得到对应标签及通过爬虫方式进行热门网页采集后再推荐给用户,提高用户体验感与不同站点的网页个性化需求。感与不同站点的网页个性化需求。感与不同站点的网页个性化需求。

【技术实现步骤摘要】
一种基于标签与图的网页推荐方法、终端设备及存储介质


[0001]本专利技术涉及互联网
,尤其涉及一种基于标签与图的网页推荐方法、终端设备及存储介质。

技术介绍

[0002]随着互联网的发展,已经进入网页信息过载时代。在这个大数据时代,让用户从海量的信息中找到自己想要的信息变得越来越困难。为了解决信息过载问题,市场上出现了多种个性化服务系统,将通过搜索引擎、用户行为等特征选择对应重点热门的网页信息推荐给用户。现有的个性化服务系统存在以下缺点:(1)个性化网页推荐都必须有用户参与,同时有些系统还需要用户提交反馈信息;(2)大多数推荐系统的推荐仅仅是根据当前大多数用户常用的网站进行推荐,并不能满足用户的个性化需求,用户体验感差。

技术实现思路

[0003]为了解决上述问题,本专利技术提出了一种基于标签与图的网页推荐方法、终端设备及存储介质。
[0004]具体方案如下:
[0005]一种基于标签与图的网页推荐方法,包括以下步骤:
[0006]S1:对所有的用户信息进行分析,提取所有用户对应的所有兴趣标签与权本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于标签与图的网页推荐方法,其特征在于,包括以下步骤:S1:对所有的用户信息进行分析,提取所有用户对应的所有兴趣标签与权重;S2:通过爬虫系统采集新的网页,并计算每个网页与每个兴趣标签的关联关系和权重;S3:采用基于图的推荐算法,计算出每个用户的待推荐网页列表,并进行展示。2.根据权利要求1所述的基于标签与图的网页推荐方法,其特征在于:步骤S2具体包括以下步骤:S201:爬虫系统对采集的网页进行数据清洗,以得到网页的标题和正文内容;S202:判断标题和正文的内容中是否包含兴趣标签,如果是,进入S203;否则,结束;S203:根据标题和正文的内容中各兴趣标签出现的个数,分别计算每个兴趣标签对应的标题和正文的权重;S204:合并每个兴趣标签对应的标题和正文的权重得到每个兴趣标签对应的网页的权重。3.根据权利要求2所述的基于标签与图的网页推荐方法,其特征在于:步骤S203中每个兴趣标签对应的标题的权重的计算公式为:3*n/N,其中,n表示标题中该兴趣标签出现的次数,N表示标题中所有兴趣标签出现的总次数;每个兴趣标签对应的正文的权重的计算公式为:1*m/M,其中,m表示正文中该兴趣标签出现的次数,M表示正文中所有兴趣标签出现的总次数。4.根据权利要求1所述的基于标签与图的网页推荐方法,其特征在于:步骤S3包括以下步骤:S301:采用结构为(用户,标签,网页)的数据源,构建...

【专利技术属性】
技术研发人员:林志扬黄南松陈强徐晓文
申请(专利权)人:厦门市美亚柏科信息股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1