一种个性化在线课程与职业双向推荐方法及系统技术方案

技术编号:22884023 阅读:16 留言:0更新日期:2019-12-21 07:19
本发明专利技术公开了一种个性化在线学习与职业双向推荐方法及系统,对于学习者,可以根据其感兴趣的求职目标,推荐最需要学习的课程,使用户在学习的过程中做到有的放矢,保证了用户的学习效果;当用户未指定求职目标时,可根据用户的预有知识以及在线学习情况推荐最合适的职业,培养用户的职业规划意识,对于企业,则根据用户的学习情况选择最适合的求职者,因此,本发明专利技术对于用户的在线学习质量提高以及求职发展都具有十分重要的意义。

A personalized online course and professional two-way recommendation method and system

【技术实现步骤摘要】
一种个性化在线课程与职业双向推荐方法及系统
本专利技术涉及机器学习领域,具体涉及一种个性化在线课程与职业双向推荐方法及系统。
技术介绍
伴随着网上学习的普及以及在线课程资源的增多,越来越多的在职工作者与在校大学生通过网络学习提升自身的求职技能,然而面对海量的在线课程如何快速找到理想岗位最紧迫需要学习的内容,如何根据自身已有的知识制定合理的职业学习方向,成为困扰在线学习者最大的难题。推荐系统是当今解决海量信息所带来的“信息超载”问题的有效方法之一,近年来广泛使用于购物网站、音乐推荐系统等,其核心在于快速把握用户的需要与特性,从大规模数据中挖掘出用户的需求信息,建立用户与物品之间的联系。常用的推荐算法包括:基于内容的推荐、基于协同过滤的推荐、基于关联规则的推荐、基于标签的推荐和基于混合模型的推荐等。在线课程推荐属于推荐系统在教育教学中的应用之一,以往的在线课程推荐多集中于使用内容或协同过滤的推荐方法。基于使用内容的方法是根据用户已有的选择推荐相似的产品,然而单一课程的重复学习对于学习者来说并没有实际的价值。基于协同过滤的方法,通过计算学习者用户之间的相似度,将相似用户所购买的商品推荐给其他用户,然而在课程与职业双向推荐过程中,通过推荐相似学习者的求职目标,并不能让学习者有清晰的求职方向,反而,学习者需要经过大量的课程学习才能从繁杂的职业推荐中才找到自己感兴趣的职业。
技术实现思路
针对现有技术的不足,本专利技术旨在提供一种个性化在线课程与职业双向推荐方法及系统。为了实现上述目的,本专利技术采用如下技术方案:一种个性化在线学习与职业双向推荐方法,包括如下步骤:S1、建立特征词词典向量:S1.1、以专业为单位,使用网络爬虫获取求职网站中和单个专业相关的职业要求信息;S1.2、动词标签以及权重的确定:S1.2.1、将职业要求中的动词定义为动词标签V-tagi;S1.2.2、确定动词标签的权值以薪酬工资为划分依据,对某一专业所有的职业要求信息进行语料处理,获取同一动词标签在不同薪酬的职业要求中的出现频率,确定动词标签的权值;各个动词标签的权值按下式进行计算:最终,动词标签及权重可表示为V-tagi表示第i个动词标签,表示第i个动词标签对应的权值;n表示动词标签的总数。S1.3、知识点分词标签的获取:从职业要求中过滤所有的动词标签以及学历、沟通能力有关字段,提取职业要求中的具体技能作为知识点分词标签;S1.4、动词标签及其权值与知识点分词标签共同构成特征词词典向量;S2、建立职业标签向量和课程标签向量S2.1、提取某一职业的职业要求,逐行处理职业要求信息,利用特征词词典向量识别出其中的动词标签及其权值和知识点分词标签,并据此将其转换为职业标签向量;所述职业标签向量包括知识点分词标签及其权值,所述知识点分词标签的权值等于和该知识点分词标签组成动宾短语的动词标签在特征词词典向量中的权值;S2.2、建立课程标签向量;所述课程标签向量主要由两部分构成:知识点分词标签及其权值,所述知识点分词标签的权值人为根据该课程的学习目标指定;S3、推荐最合适的职业或最紧迫需要学习的课程:(1)推荐最合适的职业:(1.1)、首先根据用户的专业获取所有相关的职业列表L(l1,l2,l3,…,ls),s表示职业列表中包含的职业数量;(1.2)、计算职业列表中所有职业与用户课程的匹配度:和分别表示课程C和职业L的课程标签向量和职业标签向量;wtag,i代表这些相同知识点分词标签对应的权重值,i=0,1,2,...,r,r表示课程C和职业L中相同知识点分词标签的个数;最终得到课程与各个职业的匹配度G,取其中匹配度G最高的职业作为用户的推荐职业;(2)推荐最紧迫需要学习的课程(2.1)、首先根据用户的目标职业L,获取与其相关的所有课程列表C(c1,c2,c3,…,cv),v表示课程列表中包含的课程数量;(2.2)、计算职业列表中所有课程与用户目标职业L的匹配度:和分别表示课程C和目标职业L的课程标签向量和职业标签向量;wtag,i代表这些相同知识点分词标签对应的权重值,i=0,1,2,...,r,r表示课程C和职业L中相同知识点分词标签的个数;最终得到用户目标职业与各个课程的匹配度G,取其中匹配度G最低的课程作为用户的推荐课程。进一步地,步骤S1.2.1中,具体对职业要求语料进行分词、停用词、过滤词标记,获取所有的动词特征词标签列表,取频率最多出现的若干个动词作为动词标签。更进一步地,分词、停用词、过滤词标记之后,人工剔除无关字段。进一步地,步骤S2.2的具体过程为:当添加新的课程时,从步骤S1建立得到的特征词词典向量中提取一个或多个知识点分词标签指定为该课程的知识点分词标签,并根据该课程的学习目标指定各个知识点分词标签在该课程中的权值,则该课程的所有知识点分词标签及其权值构成该课程的课程标签向量。进一步地,所述方法还包括有如下步骤:用户课程预测模型的建立:根据用户的专业获取用户专业有关的所有课程的集合C;C划分为两大部分:与用户预有知识相关的课程集合Cpre,以及用户在系统中学习的课程集合Con_line;所有课程的集合C可表示如下:C=Cpre∪Con_line;Con_line中的各个课程的得分均由用户在该课程的学习完成度p与测评分数q共同决定,p与q之和作为该课程的最终学习成绩;其中p=1、q=1表示用户已完成该课程并测验全部通过;Con_line中课程j的得分表示如下:rj=p+q;获取Con_line中课程知识点分词标签向量:首先,根据Con_line中所有课程的知识点分词标签对课程知识点标签向量进行初始化,其次依据某一课程的知识点分词标签对该课程的权值进行更新,得到该课程的课程知识点分词标签向量;Con_line的最终得分向量为:其中,j为Con_line中的某一课程,Wj表示课程j的课程知识点分词标签向量,rj为课程j的得分,Fon_line为最终计算获得的用户在线学习的所有课程Con_line的得分向量;预测Cpre集合中的课程的得分:按下式依次计算Cpre中某一课程i与Con_line中所有课程j的相似度:为课程i的课程标签向量,为课程j的课程标签向量,v=0,1,2,...,m,m表示课程i和j中相同知识点分词标签的个数,wtag,v代表这些相同知识点分词标签对应的权重值;根据课程j的得分rj,利用相似度计算获得课程i的得分,Cpre中所有课程的得分和即为Fpre,计算如下:其中,s表示Cpre中的课程总数,q表示Con_line中的课程总数,rj表示课程j的得分。本专利技术还提供一种基于上述方法的个性化在线学习与职业双向推荐系统,所述系本文档来自技高网...

【技术保护点】
1.一种个性化在线学习与职业双向推荐方法,其特征在于,包括如下步骤:/nS1、建立特征词词典向量,所述特征词词典向量中,包含各个专业相关的职业要求信息中的动词标签及权值与知识点分词标签;知识点分词标签为职业要求信息中的具体技能要求;/nS2、建立职业标签向量和课程标签向量:/nS2.1、提取某一职业的职业要求,逐行处理职业要求信息,利用特征词词典向量识别出其中的动词标签及其权值和知识点分词标签,并据此将其转换为职业标签向量;所述职业标签向量包括知识点分词标签及其权值,所述知识点分词标签的权值等于和该知识点分词标签组成动宾短语的动词标签在特征词词典向量中的权值;/nS2.2、建立课程标签向量;所述课程标签向量主要由两部分构成:知识点分词标签及其权值,所述知识点分词标签的权值人为根据该课程的学习目标指定;/nS3、推荐最合适的职业或最紧迫需要学习的课程:/n(1)推荐最合适的职业:/n(1.1)、首先根据用户的专业获取所有相关的职业列表L(l

【技术特征摘要】
1.一种个性化在线学习与职业双向推荐方法,其特征在于,包括如下步骤:
S1、建立特征词词典向量,所述特征词词典向量中,包含各个专业相关的职业要求信息中的动词标签及权值与知识点分词标签;知识点分词标签为职业要求信息中的具体技能要求;
S2、建立职业标签向量和课程标签向量:
S2.1、提取某一职业的职业要求,逐行处理职业要求信息,利用特征词词典向量识别出其中的动词标签及其权值和知识点分词标签,并据此将其转换为职业标签向量;所述职业标签向量包括知识点分词标签及其权值,所述知识点分词标签的权值等于和该知识点分词标签组成动宾短语的动词标签在特征词词典向量中的权值;
S2.2、建立课程标签向量;所述课程标签向量主要由两部分构成:知识点分词标签及其权值,所述知识点分词标签的权值人为根据该课程的学习目标指定;
S3、推荐最合适的职业或最紧迫需要学习的课程:
(1)推荐最合适的职业:
(1.1)、首先根据用户的专业获取所有相关的职业列表L(l1,l2,l3,…,ls),s表示职业列表中包含的职业数量;
(1.2)、计算职业列表中所有职业与用户课程的匹配度:







和分别表示课程C和职业L的课程标签向量和职业标签向量;wtag,i代表这些相同知识点分词标签对应的权重值,i=0,1,2,...,r,r表示课程C和职业L中相同知识点分词标签的个数;
最终得到课程与各个职业的匹配度G,取其中匹配度G最高的职业作为用户的推荐职业;
(2)推荐最紧迫需要学习的课程
(2.1)、首先根据用户的目标职业L,获取与其相关的所有课程列表C(c1,c2,c3,…,cv),v表示课程列表中包含的课程数量;
(2.2)、计算职业列表中所有课程与用户目标职业L的匹配度:







和分别表示课程C和目标职业L的课程标签向量和职业标签向量;wtag,i代表这些相同知识点分词标签对应的权重值,i=0,1,2,...,r,r表示课程C和职业L中相同知识点分词标签的个数;
最终得到用户目标职业与各个课程的匹配度G,取其中匹配度G最低的课程作为用户的推荐课程。


2.根据权利要求1所述的方法,其特征在于,步骤S1的具体过程为:
S1.1、以专业为单位,使用网络爬虫获取求职网站中与单个专业相关的职业要求信息;
S1.2、动词标签以及权重的确定:
S1.2.1、将职业要求中的动词定义为动词标签V-tagi;
S1.2.2、确定动词标签的权值以薪酬工资为划分依据,对某一专业所有的职业要求信息进行语料处理,获取同一动词标签在不同薪酬的职业要求中的出现频率,确定动词标签的权值;各个动词标签的权值按下式进行计算:



最终,动词标签及权重可表示为V-tagi表示第i个动词标签,表示第i个动词标签的权值;n表示动词标签的总数;
S1.3、知识点分词标签的获取:
从职业要求中过滤所有的动词标签以及学历、沟通能力等有关字段,提取职业要求中的具体技能作为知识点分词标签;
S1.4、动词标签及其权值与知识点分词标签共同构成特征词词典向量。


3.根据权利要求2所述的方法,其特征在于,步骤S1.2.1中,具体对职业要求语料进行分词、停用词、过滤词标记,获取所有的动词特征词标签列表,取频率最多出现的若干个动词作为动词标签。


4.根...

【专利技术属性】
技术研发人员:王晶晶谢浩然陈伟康
申请(专利权)人:香港教育大学
类型:发明
国别省市:中国香港;HK

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1