一种基于学习者偏好建模的个性化学习资源推荐方法技术

技术编号:25042248 阅读:28 留言:0更新日期:2020-07-29 05:32
本发明专利技术提供的是一种基于学习者偏好建模的个性化学习资源推荐方法。其特征是:将从在线学习平台中获取学习者相关学习日志文件,包括学习者的历史课程注册记录、对应课程分数以及课程相关属性等数据作为输入数据,通过嵌入注意力机制来更好地获取学习者的历史课程偏好,将其作为自动编码器神经网络的编码输入,然后构建课程知识图谱获得课程先决知识关系,根据课程之间的关联性进行解码,最后计算出学习者学习目标课程的概率,根据概率由大到小来生成学习者的目标推荐列表,以此提高推荐结果的个性化和准确性。

【技术实现步骤摘要】
一种基于学习者偏好建模的个性化学习资源推荐方法(一)
本专利技术涉及机器学习、推荐系统以及数据挖掘等
,具体是涉及一种面向学习资源推荐的学习者画像构建方法。(二)
技术介绍
随着教育信息化深入发展,在线教育资源的数量呈现出指数级增长的趋势,如何帮助学习者从海量的数据中获取他们想要的学习资源对在线学习平台来说至关重要。因此,如何根据学习者的历史注册课程来构建学习者的偏好特征,这是个性化学习资源推荐系统的关键。以往的学习者偏好建模方法,大多数都是根据用户历史注册的课程记录,通过生成课程的特征向量来刻画学习者的偏好特征,进而给学习者生成个性化的学习资源推荐。然而,用户历史注册课程记录仅包含有限的特征信息,由于课程的特征生成的学习者偏好过于单一,无法全面地表示学习者的兴趣,不能很好地满足学习者个性化的要求,同时也没有考虑学习者--课程交互数据的稀疏性和冷启动问题,不能准确地根据学习者的偏好给学习者推荐所需要的信息。目前已公布的专利技术专利“面向个性化学习的教育资源推荐方法及系统”,公开号为CN106528693A,通过学习者的基本特征数据对学习者兴趣进行建模,并计算不同学习者之间以及不同学习资源之间的相似度,进而生成目标学习者的资源推荐结果。该专利技术没有考虑学习者历史课程学习对推荐服务的不同影响,也忽略了学习资源之间的关联性,没能较准确地给用户推荐服务。另外已公布的专利技术专利“一种基于思维地图的网络学习资源推荐方法”,公开号为CN103455576B,通过分析学习者访问基于知识图谱的网络学习系统的学习行为日志,以点击流来评判学习时间,并根据学习路径挖掘出相关知识元图谱,从而反馈给学习者进行推荐服务。该专利技术考虑了学习资源的关联性,但是却忽略了学习者的历史偏好,根据学习时间不能很好地展现学习者的偏好。本专利技术描述的“一种基于学习者偏好建模的个性化学习资源推荐方法”将用户的历史访问项目输入到自动编码器(AE)中生成课程的特征向量,为了更好地刻画学习者的历史注册课程记录对目标推荐课程的不同影响以及表征学习者多样化的偏好,本专利技术设计了通过注意力网络编码来构建学习者的偏好向量,以及利用课程先决知识条件关系来构建课程知识图谱,并通过高斯径向基函数核(RBF)计算课程之间的关联度进行解码,最后通过得到学习者的偏好向量与课程间的先决关系来计算出学习者学习课程的概率,根据概率由大到小生成学习者的推荐列表,以此提高推荐结果的个性化和准确性。(三)
技术实现思路
本专利技术所要解决的是目前基于学习者偏好建模个性化推荐方法中,学习者-课程交互数据的稀疏性问题,学习者偏好无法合理地扩展以及没有考虑学习者历史注册课程记录对目标课程的不同影响以及课程关联语义信息等问题,提供了一种基于学习者偏好建模的个性化学习资源推荐方法。为实现上述目的,本专利技术的具体方案如下:一种基于学习者偏好建模的个性化学习资源推荐方法,包括以下步骤:步骤一:获取在线学习平台上的学习者相关学习日志文件。由于采集到的原始数据不能直接用于之后的计算,需要对采集到的原始数据进行数据的预处理操作。步骤二:学习者注册该课程且进行学习考试后得到这门课程的成绩,该结课成绩为百分制。则根据学习者历史注册课程的成绩信息,将该学习者已学习的课程分别划分为正例和负例。步骤三:利用课程及其各种属性,构建课程的实体关系三元组,然后以实体关系三元组为基础单元构建相关的课程知识图谱,发掘出课程之间的关联性。步骤四:为了刻画用户历史课程对目标课程的不同影响以及区分学习者对不同类型课程的偏好,引入注意力机制更好地获得学习者的历史偏好向量。步骤五:将学习者历史偏好向量与课程之间关联度分别作为编码与解码输入至自动编码器神经网络中,获得学习者的目标课程推荐列表。进一步的,所述步骤一中,学习者相关学习日志文件包括学习者的历史课程注册记录、课程分数和课程相关属性数据,其存储于在线学习平台的网页日志中,可利用相关的爬虫工具技术爬取出学习者的学习行为记录,将其存储于数据库中。进一步的,所述存储在数据库中的数据由于直接从网上爬取,并未进行数据清洗,数据存在不完整、格式不统一等问题,需要对数据进行相关的数据预处理操作。进一步的,所述步骤二中,为了方便今后处理以及考虑学习者的隐私问题,对数据处理后的学习者的日志记录的各属性值进行相应方式编码,通过学习者的历史成绩将其划分为正负例,具体过程包括:(1)遍历学习者的日志文件记录表,获得学习者每门课程对应的课程成绩;(2)给每门课程分配一个标签,若学习者获得的课程成绩大于60分,将其作为用户会喜欢的项目(正例),并赋予标签为1,小于60分的为用户为不喜欢的项目(负例),赋予标签为0;进一步的,所述步骤三中,使用网络表示学习方法学习课程知识图谱中的结点结构及其属性特征,将课程知识图谱中每个实体和关系表示为一个对应的低维特征向量,进一步的,再根据每个实体的特征向量生成该实体的上下文特征向量,根据该课程实体之间的上下文特征向量利用高斯径向基函数(RBF)计算出课程相互之间的关联度;进一步的,在步骤四中,将预处理后的学习者历史注册课程的多热向量中添加注意力系数,计算学习者对每个历史注册课程的影响权重,通过添加注意力系数计算学习者对历史注册课程向量表示并进行加权和,进而得到学习者对目标课程的偏好向量。进一步的,在步骤五中,构建基于自动编码器神经网络的课程推荐模型,确定自动编码器的神经网络具有三层,即输入层、隐含层和输出层,自动编码器神经网络的各参数值得设置方法如下:(1)确定自动编码器神经网络输入层神经元个数,设定输入层神经元个数为学习者对应课程标签的个数;(2)确定自动编码器神经网络隐含层神经元个数;(3)确定自动编码器神经网络各层的激活函数;(4)确定自动编码器神经网络编码与解码的方法;(5)确定自动编码器神经网络的训练方法;(6)确定自动编码器神经网络的训练要求精度;(7)确定自动编码器神经网络的学习率。进一步的,所述步骤五中,将嵌入注意力机制获得学习者偏好向量作为自动编码器神经网络的编码输入,以及通过课程知识图谱获得的课程关联性作为自动编码器的解码。模型最后输出学习者的学习目标课程的概率,并将学习者不同目标课程的预测概率按大到小进行排列,取前K个课程获得学习者推荐目标课程列表。本专利技术的有益效果:与现有的技术相比,本专利技术具有如下优势:1.本专利技术将根据课程的特征来构成三元组,并以三元组为单元来构建课程知识图谱。三元组的使用不仅简化了数据的存储,还保留了课程的重要属性;课程知识图谱的使用能够较为显著地展示出课程之间的关系,通过关系表现出不同课程的联系,使得推荐课程据更加丰富、准确和多样化。2.本专利技术使用网络表示学习的方法,将课程知识图谱中的三元组向量化,即将课程关系三元组中的课程实体和关系映射到低维度向量空间中,将其表示成向量。该方法将繁杂的网络节点结构和属性数据表示为简单、低维的向量,不仅保留原来数本文档来自技高网
...

【技术保护点】
1.一种基于学习者偏好建模的个性化学习资源推荐方法,其特征是,包括以下步骤:/n步骤一:获取在线学习平台上的学习者相关学习日志文件。由于采集到的原始数据不能直接用于之后的计算,需要对采集到的原始数据进行数据的预处理。/n步骤二:学习者注册该课程且进行学习考试后会得到这门课程的成绩,该结课成绩为百分制。根据学习者历史注册课程的成绩信息,将该学习者历史学习课程分别划分为正例和负例。/n步骤三:利用课程及其各种属性,构建课程的实体关系三元组,然后以实体关系三元组为基础单元构建相关的课程知识图谱,发掘出课程之间的关联性。/n步骤四:为了刻画用户历史课程对目标课程的不同影响以及区分学习者对不同类型课程的偏好,引入注意力机制更好地获得学习者历史偏好向量。/n步骤五:将学习者历史偏好向量融合和课程之间的关联度分别作为编码与解码输入至自动编码器神经网络中,获得学习者的目标课程推荐列表。/n

【技术特征摘要】
1.一种基于学习者偏好建模的个性化学习资源推荐方法,其特征是,包括以下步骤:
步骤一:获取在线学习平台上的学习者相关学习日志文件。由于采集到的原始数据不能直接用于之后的计算,需要对采集到的原始数据进行数据的预处理。
步骤二:学习者注册该课程且进行学习考试后会得到这门课程的成绩,该结课成绩为百分制。根据学习者历史注册课程的成绩信息,将该学习者历史学习课程分别划分为正例和负例。
步骤三:利用课程及其各种属性,构建课程的实体关系三元组,然后以实体关系三元组为基础单元构建相关的课程知识图谱,发掘出课程之间的关联性。
步骤四:为了刻画用户历史课程对目标课程的不同影响以及区分学习者对不同类型课程的偏好,引入注意力机制更好地获得学习者历史偏好向量。
步骤五:将学习者历史偏好向量融合和课程之间的关联度分别作为编码与解码输入至自动编码器神经网络中,获得学习者的目标课程推荐列表。


2.根据权利要求1所述的一种基于学习者偏好建模的个性化学习资源推荐方法,所述学习者相关学习日志文件为某个学习者于在线学习平台中的历史课程注册记录、课程分数和课程相关属性数据,利用相关的爬虫工具技术爬取出学习者的学习行为记录,或者与后台服务器直接连接,将所需信息存储于数据库中。


3.根据权利要求1所述的一种基于学习者偏好建模的个性化学习资源推荐方法,其特征是,爬取到的数据中学习者可能存在课程成绩的缺失或者异常,需要对其进行数据的预处理,如对不完整或缺失数据记录进行删除,以及为保护学习者隐私,采用对学习者和课程进行数值编码的方式,规范化的数据更利于今后的操...

【专利技术属性】
技术研发人员:刘铁园谭金丹常亮古天龙李龙
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:广西;45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1