The present application provides a method and a system for recommending a user to browse content, obtaining a plurality of web pages within a predetermined range and extracting a number of first words of the plurality of pages; a keyword list of a predetermined target user is invoked, and the list of key words includes a number of second key words; each is calculated respectively. A correlation between each of the second keywords described, and a number of preferred keywords most interested by the target user according to the degree of correlation between each of the first key words and each of the second key words, and the page address of a web page with at least one of the preferred keywords is pushed to the target. Users. The personalized recommendation of the user's browsing content has been realized.
【技术实现步骤摘要】
一种用户浏览内容的推荐方法及系统
本专利技术涉及内容推荐
,更具体的,涉及一种用户浏览内容的推荐方法及系统。
技术介绍
互联网规模和应用面的迅速增长逐渐产生了越来越严重的信息过载问题。过量信息同时呈现,使得用户无法轻易从中获得对自己有用的部分。例如:在中文谷歌搜索引擎中中以“推荐系统”作为关键词进行搜索时可获得超过1000万条查询结果。现在很多网络应用,例如:网址导航、搜索引擎、门户网站、专业数据库索引等,本质上都是帮助用户过滤信息的工具或手段。然而,这些工具几乎都是只满足了主流的信息获取需求,不能满足用户的个性化信息需求,依然无法很好地解决信息过载问题。
技术实现思路
有鉴于此,本专利技术公开了一种用户浏览内容的推荐方法及系统,通过计算系统获取的预设范围内多个网页中第一关键词与预先建立的目标用户关键词列表中第二关键词之间的相关度,确定目标用户最感兴趣的多个偏好关键词,并将具有至少一个所述偏好关键词的网页的网页地址推送给所述目标用户,实现了用户浏览内容的个性化推荐。为了实现上述专利技术目的,本专利技术提供的具体技术方案如下:一种用户浏览内容的推荐方法,包括:获取预设范围内的多个网页,并提取所述多个网页的多个第一关键词;调用预先建立的目标用户的关键词列表,所述关键词列表中包括多个第二关键词;分别计算每个所述第一关键词与每个所述第二关键词之间的相关度,并根据每个所述第一关键词与每个所述第二关键词之间的相关度得将具有至少一个所述偏好关键词的网页的网页地址推送给所述目标用户。优选的,所述获取预设范围内的多个网页,并提取所述多个网页的多个第一关键词,包括:获取目标 ...
【技术保护点】
一种用户浏览内容的推荐方法,其特征在于,包括:获取预设范围内的多个网页,并提取所述多个网页的多个第一关键词;调用预先建立的目标用户的关键词列表,所述关键词列表中包括多个第二关键词;分别计算每个所述第一关键词与每个所述第二关键词之间的相关度,并根据每个所述第一关键词与每个所述第二关键词之间的相关度得到所述目标用户最感兴趣的多个偏好关键词;将具有至少一个所述偏好关键词的网页的网页地址推送给所述目标用户。
【技术特征摘要】
1.一种用户浏览内容的推荐方法,其特征在于,包括:获取预设范围内的多个网页,并提取所述多个网页的多个第一关键词;调用预先建立的目标用户的关键词列表,所述关键词列表中包括多个第二关键词;分别计算每个所述第一关键词与每个所述第二关键词之间的相关度,并根据每个所述第一关键词与每个所述第二关键词之间的相关度得到所述目标用户最感兴趣的多个偏好关键词;将具有至少一个所述偏好关键词的网页的网页地址推送给所述目标用户。2.根据权利要求1所述的方法,其特征在于,所述获取预设范围内的多个网页,并提取所述多个网页的多个第一关键词,包括:获取目标用户集合中每个用户在第一预设周期内所浏览的每个网页地址;获取与每个所述网页地址相对应的网页内容,对每个网页内容进行分词,得到多个关键词;基于词频-逆文档频率算法计算每个所述关键词的TF-IDF值,并将每个所述网页对应的多个所述关键词中TF-IDF值大于预设值的关键词确定为第一关键词,所述第一关键词与所述网页地址之间具有映射关系。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取所述目标用户的历史浏览数据,并基于词频-逆文档频率算法提取多个第二关键词,每个所述第二关键词对应一个TF-IDF值;为每个所述第二关键词设置标签,根据不同标签为所述目标用户建立多个关键词列表,每个关键词列表中的多个所述第二关键词对应一个相同标签。4.根据权利要求2和3所述的方法,其特征在于,所述分别计算每个所述第一关键词与每个所述第二关键词之间的相关度,并根据每个所述第一关键词与每个所述第二关键词之间的相关度得到所述目标用户最感兴趣的多个偏好关键词,包括:获取每个所述第一关键词的标签,并将具有相同标签的多个所述第一关键词和多个所述第二关键词分组;根据每个所述第一关键词的TF-IDF值和每个所述第二关键词的TF-IDF值,分别计算每组中每个所述第一关键词与每个所述第二关键词的相关度;对多个相关度由大到小进行排序,每个所述第一关键词对应一个相关度排名,将满足预设相关度排名的多个所述第一关键词确定为所述目标用户最感兴趣的多个偏好关键词。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述目标用户在第一预设周期内所浏览的每个网页中多个关键词,对所述目标用户的关键词列...
【专利技术属性】
技术研发人员:林皓,李光,李鹏,王兆峰,
申请(专利权)人:江苏神州信源系统工程有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。