一种基于混合模型的个性化职位信息推荐系统及实现方法技术方案

技术编号：12091414 阅读：118 留言：0更新日期：2015-09-23 09:45

本发明专利技术公开了一种基于混合模型的个性化职位信息推荐系统及实现方法，推荐系统自上而下包括表现层，推荐层，信息抽取层和信息采集层；层与层之间通过共享数据实现衔接；信息采集层负责编写网络爬虫程序；信息抽取层负责从特征页面中解析原始的职位信息，将底层获取的特征链接上传至HDFS文件系统；推荐层负责整个职位推荐系统的推荐引擎算法；表现层向用户提供交互界面，将推荐层计算出的推荐项目，通过网页的形式向求职者展现。本发明专利技术的推荐系统一定程度上降低了系统冷启动和矩阵稀疏性带来的影响，推荐的结果更全面和精确，增强系统的粘性和用户体验。

全部详细技术资料下载

【技术实现步骤摘要】

本文涉及个性化推荐，数据挖掘领域。
技术介绍
随着大数据的思想落地，推荐系统渐渐受到业界的热捧，它给互联网带来的效益是无法估量的。不仅仅是电商，各种互联网行业慢慢的都引入了推荐技术，例如：电影网站、音乐播放器、社交平台、职位招聘、餐饮服务等等。对推荐系统而言，推荐结果的好坏严重影响用户对服务的评价。但是，目前大多数中小型应用中建立的推荐功能由于算法策略选取和设计的不合理，使推荐结果不准确。冷启动和评分稀疏的问题一直是推荐方面不可避免的难题，针对这两个问题，本文提出一种基于并行式的混合推荐策略，设计了一套完整的职位信息推荐系统。针对系统采集的职位信息文本利用Lucene分词器和TF-IDF算法挖掘出文本中的具有主题含义的关键词。新用户注册时系统提供引导页面采集背景知识。对背景知识采用同样的方法挖掘关键词，选择恰当的相似性计算方法计算匹配新用户背景的职位进行推荐，这是一种典型的基于内容的推荐方式。另外系统还提出了一种基于聚类的协同过滤算法，通过填补预测评分优化用户-物品评分矩阵降低矩阵的稀疏度，利用FP-Growth关联挖掘算法发现潜在的关联规则，向用户推荐可能的职位组合，最后，基于归纳统计设计辅助推荐策略，增强系统粘性。
技术实现思路
为了解决以往的求职系统中个性化和智能化不足、以及冷启动和评分稀疏的问题，本文专利技术提出了一种基于混合模型的个性化职位信息推荐系统，采用多种推荐思想策略和结合职位招聘系统自身的特点设计一套个性化的职位信息推荐系统，采用的技术方案为： -种基于混合模型的个性化职位信息推荐系统，包括...

【技术保护点】
一种基于混合模型的个性化职位信息推荐系统，其特征在于，包括表现层，推荐层，信息抽取层和信息采集层；所述信息采集层与所述信息抽取层之间、所述信息抽取层与所述推荐层之间、所述推荐层与所述表现层之间均通过共享数据实现衔接；所述信息采集层负责从互联网招聘网站中抓取特征链接，编写网络爬虫程序，基于Nutch进行二次开发，通过修改Nutch中Crawl类代码，采用正则表达式对外链接进行过滤得到需要的特征链接，并将特征链接保存在本地的CrawlDb文件数据库中；所述信息抽取层负责从特征页面中解析原始的职位信息，将底层获取的特征链接上传至HDFS文件系统；所述推荐层负责整个职位推荐系统的推荐引擎算法，所述算法包括：基于内容的推荐算法、基于聚类分析的协同过滤算法，基于关联规则的推荐算法、基于归纳统计的辅助推荐算法；所述表现层负责向用户提供交互界面，将推荐层计算出的推荐项目，通过网页的形式向求职者展现。

【技术特征摘要】

【专利技术属性】
技术研发人员：薛安荣，黄祖卫，
申请(专利权)人：江苏大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人