基于半监督学习的大规模网络开放课程退课预测算法制造技术

技术编号:14861331 阅读:60 留言:0更新日期:2017-03-19 14:23
本发明专利技术涉及基于半监督学习的大规模网络开放课程退课预测算法,首先从慕课网站获取用户的学习日志文件,获取的用户一部分构成测试样本集,另一部分构成训练样本集;其次根据用户的学习日志文件统计训练样本集中所有样本的行为特征,得到最能表达训练样本集中所有样本共有特性的n种行为特征;第三根据n种行为特征采用半监督学习方法获得R种分类器;第四使用测试样本集对R种分类器的标注准确率进行测试,选出标注准确率最高的分类器,最后将任意一个未标记的用户的行为特征输入上述分类器,即可对给用户进行标记。该算法只需要使用较少的标记样本即可,减少了对样本进行标注花费的大量人力和物力,不但节约了预测成本,而且预测准确率也提高了。

【技术实现步骤摘要】

本专利技术涉及计算机与信息技术,具体涉及一种基于半监督学习的大规模网络开放课程退课预测算法
技术介绍
Web2.0及云计算等技术的成熟给教育信息化提供了新的契机,大型在线公开课程(MOOC,又称慕课)便是互联网应用创新的产物。随着edx、coursera及udacity等MOOC网站的兴起以及MIT,Stanford等大学相继在MOOC平台开设课程,MOOC受到了越来越多的关注与认同。MOOC依托互联网,为大量的学生提供教育诸如答题,考试,看视频等教育体验,并能够让学生利用网络论坛等形式协同学习。并且MOOC具备的开放性特点,使得MOOC为不同学习背景的学生提供学习机会。尽管MOOC与传统教育相比拥有其独特的优点,但是MOOC的学习者群体具有较大的差异性。这种差异性主要体现在教育背景与教育动机上,如有的学生仅仅为了获取某一个知识点而注册某门课程,并且由于退出MOOC课程的代价较低,这就导致学习者的退课率过高。许多教育者指出MOOC的高退课率是一种普遍的现象,如果本文档来自技高网...

【技术保护点】
基于半监督学习的大规模网络开放课程退课预测算法,其特征在于,包括如下步骤:S1:从MOOC网站获取用户的学习日志文件,获取的用户一部分构成测试样本集,另一部分构成训练样本集,其中测试样本集中的测试样本全部是已标记样本,该训练样本集中包括未标记样本和已标记样本,所有未标记样本构成未标记样本集,所有已标记样本构成标记样本集;S2:根据用户的学习日志文件统计训练样本集中所有样本的行为特征,得到最能表达训练样本集中所有样本共有特性的n种行为特征;设某一课程的课程持续时间为K周;设Ui={U(i,1),....,U(i,j),....,U(i,n)},Ui表示训练样本集中的第i个样本,U(i,j)={(...

【技术特征摘要】
1.基于半监督学习的大规模网络开放课程退课预测算法,其特征在于,
包括如下步骤:
S1:从MOOC网站获取用户的学习日志文件,获取的用户一部分构成测
试样本集,另一部分构成训练样本集,其中测试样本集中的测试样本全部是
已标记样本,该训练样本集中包括未标记样本和已标记样本,所有未标记样<...

【专利技术属性】
技术研发人员:江峰李文涛
申请(专利权)人:重庆工商职业学院
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1