The invention discloses a system for intelligent recommendation of resources, including the collection module of cyber source, the cyber source collection module comprises a crawler distribution device and crawler unit, the cyber source collection module is connected with the crawler module and the page decomposition module, web page decomposition module is connected with the database, connected with the collection work temporary incremental database, temporary incremental database connected with incremental updating database, incremental updating database connection selection module, filter module is connected with the local file system and interface module, the local file system and database connection.
【技术实现步骤摘要】
一种新型智能推荐资源的系统
本专利技术涉及一种系统,具体涉及一种新型智能推荐资源的系统。
技术介绍
借助于互联网技术,大数据应用在各个方面持续深化,尤其是在人们的生活领域内,给人们的生活带来了很多的便利。比如说推荐类的新闻客户端,类似于今日头条、网易新闻、凤凰新闻等,有效地聚集了高质量的新闻,针对用户的点击、阅读行为展开新闻推荐。新闻的内容涉及娱乐、体育、军事、科技、财经等,由此可见,它们更加集中于人们的生活领域。然而,面对着各种巨大工作压力,在人们的工作领域,同样,甚至更加需要这样一种资讯推荐来不断提升用户的工作能力,开阔工作视野。目前,还没有发现市场上有这样一款集聚资源、面向工作的推荐应用。当前,人们在工作过程中遇到问题,通常是有两种方式解决:1.搜索引擎的出现,类似百度,可以给人们的工作带来很大的帮助,但是,同时需要人们从大量充斥着各种资源的互联网中去寻找可能有用的信息。大量无效信息(广告)以及重复信息的筛选,将消耗用户大量时间和精力。2.在移动互联时代,人们的生活极度的碎片化,上班路上、休息间隙等等,手机都成了人们严重依赖的工具。如何能够帮助人们利用这些碎片化时间提升自己的个人能力,有些应用(比如微信公众号、专业网站的移动客户端)其实在一定程度上做到了这一点,但是它的问题在于内容过于分散,资源不够集中,同时也不能够满足针对用户个人情况的个性化服务。因此,如果能有一种应用,能够汇聚集中互联网上的各种优质资源,根据用户的个人岗位和用户使用行为,针对用户自身需求进行个性化推荐服务,将极大地提升用户的工作能力和个人素质。
技术实现思路
本专利技术所要解决的技术 ...
【技术保护点】
一种新型智能推荐资源的系统,其特征在于,包括网络资源收集模块,所述网络资源收集模块包括爬虫分配装置和爬虫执行单元,所述网络资源收集模块连接有爬虫依赖模块和网页分解模块,网页分解模块连接有工作数据库,工作收集库连接有临时增量数据库,临时增量数据库连接有更新增量数据库,更新增量数据库连接有筛选模块,筛选模块连接有本地文件子系统和交互模块,所述本地文件子系统与工作数据库连接;所述爬虫依赖模块用于配置网络资源收集模块与目标网络资源之间的依赖关系;网络资源收集模块能够通过爬虫依赖模块建立的依赖关系,通过爬虫分配装置配置相应爬虫执行单元执行资源收集;所述网页分解模块用于网页的分解、去除广告信息、去除噪声;所述工作数据库用于和当前用户兴趣内容做相似度比较,根据相似度排序为用户推送内容;所述更新增量数据库用于存储一个时间周期内网站更新的内容;所述临时增量数据库用于存储接着上次爬取断点爬取到的内容;所述交互模块用于分析用户的兴趣爱好,常输入关键字;所述筛选模块用于筛选用户在更新增量数据库中交互模块中得到关键字;所述本地文件子系统用于存储通过筛选模块中的网页数据。
【技术特征摘要】
1.一种新型智能推荐资源的系统,其特征在于,包括网络资源收集模块,所述网络资源收集模块包括爬虫分配装置和爬虫执行单元,所述网络资源收集模块连接有爬虫依赖模块和网页分解模块,网页分解模块连接有工作数据库,工作收集库连接有临时增量数据库,临时增量数据库连接有更新增量数据库,更新增量数据库连接有筛选模块,筛选模块连接有本地文件子系统和交互模块,所述本地文件子系统与工作数据库连接;所述爬虫依赖模块用于配置网络资源收集模块与目标网络资源之间的依赖关系;网络资源收集模块能够通过爬虫依赖模块建立的依赖关系,通过爬虫分配装置配置相应爬虫执行单元执行资源收集;所述网页分解模块用于网页的分解、去除广告信息、去除噪声;所述工作数据库用于和当前用户兴趣内容做相似度比较,根据相似度排序为用户推送内容;所述更新增量数据库用于存储一个时间周期内网站更新的内容;所述临时增量数据库用于存储接着上次爬取断点爬取到的内容;所述交互模块用于分析用户的兴趣爱好,常输入关键字;所述筛选模块用于筛选用户在更新增量...
【专利技术属性】
技术研发人员:肖雪松,
申请(专利权)人:成都明途科技有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。