一种用户浏览内容的推荐方法及系统技术方案

技术编号:17878996 阅读:19 留言:0更新日期:2018-05-06 00:47
本申请提供的一种用户浏览内容的推荐方法及系统,获取预设范围内的多个网页,并提取所述多个网页的多个第一关键词;调用预先建立的目标用户的关键词列表,所述关键词列表中包括多个第二关键词;分别计算每个所述第一关键词与每个所述第二关键词之间的相关度,并根据每个所述第一关键词与每个所述第二关键词之间的相关度得到所述目标用户最感兴趣的多个偏好关键词;将具有至少一个所述偏好关键词的网页的网页地址推送给所述目标用户。实现了用户浏览内容的个性化推荐。

A recommendation method and system for user browsing content

The present application provides a method and a system for recommending a user to browse content, obtaining a plurality of web pages within a predetermined range and extracting a number of first words of the plurality of pages; a keyword list of a predetermined target user is invoked, and the list of key words includes a number of second key words; each is calculated respectively. A correlation between each of the second keywords described, and a number of preferred keywords most interested by the target user according to the degree of correlation between each of the first key words and each of the second key words, and the page address of a web page with at least one of the preferred keywords is pushed to the target. Users. The personalized recommendation of the user's browsing content has been realized.

【技术实现步骤摘要】
一种用户浏览内容的推荐方法及系统
本专利技术涉及内容推荐
,更具体的,涉及一种用户浏览内容的推荐方法及系统。
技术介绍
互联网规模和应用面的迅速增长逐渐产生了越来越严重的信息过载问题。过量信息同时呈现,使得用户无法轻易从中获得对自己有用的部分。例如:在中文谷歌搜索引擎中中以“推荐系统”作为关键词进行搜索时可获得超过1000万条查询结果。现在很多网络应用,例如:网址导航、搜索引擎、门户网站、专业数据库索引等,本质上都是帮助用户过滤信息的工具或手段。然而,这些工具几乎都是只满足了主流的信息获取需求,不能满足用户的个性化信息需求,依然无法很好地解决信息过载问题。
技术实现思路
有鉴于此,本专利技术公开了一种用户浏览内容的推荐方法及系统,通过计算系统获取的预设范围内多个网页中第一关键词与预先建立的目标用户关键词列表中第二关键词之间的相关度,确定目标用户最感兴趣的多个偏好关键词,并将具有至少一个所述偏好关键词的网页的网页地址推送给所述目标用户,实现了用户浏览内容的个性化推荐。为了实现上述专利技术目的,本专利技术提供的具体技术方案如下:一种用户浏览内容的推荐方法,包括:获取预设范围内的多个网页,并提取所述多个网页的多个第一关键词;调用预先建立的目标用户的关键词列表,所述关键词列表中包括多个第二关键词;分别计算每个所述第一关键词与每个所述第二关键词之间的相关度,并根据每个所述第一关键词与每个所述第二关键词之间的相关度得将具有至少一个所述偏好关键词的网页的网页地址推送给所述目标用户。优选的,所述获取预设范围内的多个网页,并提取所述多个网页的多个第一关键词,包括:获取目标用户集合中每个用户在第一预设周期内所浏览的每个网页地址;获取与每个所述网页地址相对应的网页内容,对每个网页内容进行分词,得到多个关键词;基于词频-逆文档频率算法计算每个所述关键词的TF-IDF值,并将每个所述网页对应的多个所述关键词中TF-IDF值大于预设值的关键词确定为第一关键词,所述第一关键词与所述网页地址之间具有映射关系。优选的,所述方法还包括:获取所述目标用户的历史浏览数据,并基于词频-逆文档频率算法提取多个第二关键词,每个所述第二关键词对应一个TF-IDF值;为每个所述第二关键词设置标签,根据不同标签为所述目标用户建立多个关键词列表,每个关键词列表中的多个所述第二关键词对应一个相同标签。优选的,所述分别计算每个所述第一关键词与每个所述第二关键词之间的相关度,并根据每个所述第一关键词与每个所述第二关键词之间的相关度得到所述目标用户最感兴趣的多个偏好关键词,包括:获取每个所述第一关键词的标签,并将具有相同标签的多个所述第一关键词和多个所述第二关键词分组;根据每个所述第一关键词的TF-IDF值和每个所述第二关键词的TF-IDF值,分别计算每组中每个所述第一关键词与每个所述第二关键词的相关度;对多个相关度由大到小进行排序,每个所述第一关键词对应一个相关度排名,将满足预设相关度排名的多个所述第一关键词确定为所述目标用户最感兴趣的多个偏好关键词。优选的,所述方法还包括:根据所述目标用户在第一预设周期内所浏览的每个网页中多个关键词,对所述目标用户的关键词列表进行更新。一种用户浏览内容的推荐系统,包括:提取单元,用于获取预设范围内的多个网页,并提取所述多个网页的多个第一关键词;调用单元,用于调用预先建立的目标用户的关键词列表,所述关键词列表中包括多个第二关键词;计算单元,用于分别计算每个所述第一关键词与每个所述第二关键词之间的相关度,并根据每个所述第一关键词与每个所述第二关键词之推送单元,用于将具有至少一个所述偏好关键词的网页的网页地址推送给所述目标用户。优选的,所述提取单元包括:获取子单元,用于获取目标用户集合中每个用户在第一预设周期内所浏览的每个网页地址;分词子单元,用于获取与每个所述网页地址相对应的网页内容,对每个网页内容进行分词,得到多个关键词;确定子单元,用于基于词频-逆文档频率算法计算每个所述关键词的TF-IDF值,并将每个所述网页对应的多个所述关键词中TF-IDF值大于预设值的关键词确定为第一关键词,所述第一关键词与所述网页地址之间具有映射关系。优选的,所述系统还包括:建立单元,用于获取所述目标用户的历史浏览数据,并基于词频-逆文档频率算法提取多个第二关键词,每个所述第二关键词对应一个TF-IDF值;为每个所述第二关键词设置标签,根据不同标签为所述目标用户建立多个关键词列表,每个关键词列表中的多个所述第二关键词对应一个相同标签。优选的,所述计算单元包括:分组子单元,用于获取每个所述第一关键词的标签,并将具有相同标签的多个所述第一关键词和多个所述第二关键词分组;计算子单元,用于根据每个所述第一关键词的TF-IDF值和每个所述第二关键词的TF-IDF值,分别计算每组中每个所述第一关键词与每个所述第二关键词的相关度;排序子单元,用于对多个相关度由大到小进行排序,每个所述第一关键词对应一个相关度排名,将满足预设相关度排名的多个所述第一关键词确定为所述目标用户最感兴趣的多个偏好关键词。优选的,所述系统还包括:更新单元,用于根据所述目标用户在第一预设周期内所浏览的每个网页中多个关键词,对所述目标用户的关键词列表进行更新。相对于现有技术,本专利技术的有益效果如下:本专利技术提供的一种用户浏览内容的推荐方法及系统,预先建立的目标用户的关键词列表体现了目标用户的浏览偏好,通过计算系统获取的预设范围内多个网页中第一关键词与预先建立的目标用户关键词列表中第二关键词之间的相关度,确定目标用户最感兴趣的多个偏好关键词,并将具有至少一个所述偏好关键词的网页的网页地址推送给所述目标用户,实现了用户浏览内容的个性化推荐。且通过相关度计算可以在用户历史数据很少的情况下快速得到目标用户最感兴趣的多个偏好关键词,解决了推荐冷启动问题。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术实施例公开的一种用户浏览内容的推荐方法流程图;图2为本专利技术实施例公开的另一种用户浏览内容的推荐方法流程图;图3为本专利技术实施例公开的又一种用户浏览内容的推荐方法流程图;图4为本专利技术实施例公开的一种用户浏览内容的推荐系统结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本实施例公开了一种用户浏览内容的推荐方法,方法流程图如图1所示,包括如下步骤:S101:获取预设范围内的多个网页,并提取所述多个网页的多个第一关键词;需要说明的是预设范围是系统预先进行设定的,预设范围内的多个网页保证网页数据足够进行后续的分析,且数据范围保持在一个合理的区间,避免数据量过大造成系统数据处理内容过载。优选的,请参阅图2,S101的具体执行过程如下:S201:获取目标用户集合中每个用户在第本文档来自技高网...
一种用户浏览内容的推荐方法及系统

【技术保护点】
一种用户浏览内容的推荐方法,其特征在于,包括:获取预设范围内的多个网页,并提取所述多个网页的多个第一关键词;调用预先建立的目标用户的关键词列表,所述关键词列表中包括多个第二关键词;分别计算每个所述第一关键词与每个所述第二关键词之间的相关度,并根据每个所述第一关键词与每个所述第二关键词之间的相关度得到所述目标用户最感兴趣的多个偏好关键词;将具有至少一个所述偏好关键词的网页的网页地址推送给所述目标用户。

【技术特征摘要】
1.一种用户浏览内容的推荐方法,其特征在于,包括:获取预设范围内的多个网页,并提取所述多个网页的多个第一关键词;调用预先建立的目标用户的关键词列表,所述关键词列表中包括多个第二关键词;分别计算每个所述第一关键词与每个所述第二关键词之间的相关度,并根据每个所述第一关键词与每个所述第二关键词之间的相关度得到所述目标用户最感兴趣的多个偏好关键词;将具有至少一个所述偏好关键词的网页的网页地址推送给所述目标用户。2.根据权利要求1所述的方法,其特征在于,所述获取预设范围内的多个网页,并提取所述多个网页的多个第一关键词,包括:获取目标用户集合中每个用户在第一预设周期内所浏览的每个网页地址;获取与每个所述网页地址相对应的网页内容,对每个网页内容进行分词,得到多个关键词;基于词频-逆文档频率算法计算每个所述关键词的TF-IDF值,并将每个所述网页对应的多个所述关键词中TF-IDF值大于预设值的关键词确定为第一关键词,所述第一关键词与所述网页地址之间具有映射关系。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取所述目标用户的历史浏览数据,并基于词频-逆文档频率算法提取多个第二关键词,每个所述第二关键词对应一个TF-IDF值;为每个所述第二关键词设置标签,根据不同标签为所述目标用户建立多个关键词列表,每个关键词列表中的多个所述第二关键词对应一个相同标签。4.根据权利要求2和3所述的方法,其特征在于,所述分别计算每个所述第一关键词与每个所述第二关键词之间的相关度,并根据每个所述第一关键词与每个所述第二关键词之间的相关度得到所述目标用户最感兴趣的多个偏好关键词,包括:获取每个所述第一关键词的标签,并将具有相同标签的多个所述第一关键词和多个所述第二关键词分组;根据每个所述第一关键词的TF-IDF值和每个所述第二关键词的TF-IDF值,分别计算每组中每个所述第一关键词与每个所述第二关键词的相关度;对多个相关度由大到小进行排序,每个所述第一关键词对应一个相关度排名,将满足预设相关度排名的多个所述第一关键词确定为所述目标用户最感兴趣的多个偏好关键词。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述目标用户在第一预设周期内所浏览的每个网页中多个关键词,对所述目标用户的关键词列...

【专利技术属性】
技术研发人员:林皓李光李鹏王兆峰
申请(专利权)人:江苏神州信源系统工程有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1