一种基于课程关联性解码的个性化课程推荐系统及方法技术方案

技术编号:39583935 阅读:7 留言:0更新日期:2023-12-03 19:34
本发明专利技术公开了一种基于课程关联性解码的个性化课程推荐系统及方法,实现了在用户偏好中进行知识感知实现推荐课程

【技术实现步骤摘要】
一种基于课程关联性解码的个性化课程推荐系统及方法
(一)

[0001]本专利技术涉及深度学习

自然语言处理以及智能推荐等
,具体是涉及一种基于课程关联性解码的个性化课程推荐系统及方法

(二)
技术介绍

[0002]网上学习逐渐成为全世界教育可选择的方式之一,一些学习平台为数百亿的学习者提供了超越时间

空间和地点等条件限制,灵活获取知识的方式和渠道,有效地促进网络教育的发展

因此,如何从众多共享的教育资源中选择适合学习者的个性化在线课程成为了网上学习的挑战之一

[0003]在传统的课程推荐中,大多数方法根据评分数据计算用户相似度从而进行推荐,容易产生冷启动问题,而且显式的评分数据具有随机性和偶然性,容易导致推荐结果与实际情况误差较大,另一方面没有考虑推荐课程的潜在特征,不能准确地向学习者推荐课程

[0004]目前已公布的专利技术专利“基于学生属性的课程推荐方法及系统”,公开号为
CN 104680453 A
,通过获取目标用户与其他用户之间的相似度,查找目标用户未选择课程且是相似度用户选修的课程来进行推荐,该专利技术没有考虑对用户的兴趣偏好会随着时间而发生改变,也忽略了课程本身的特性,很难反映用户的真实喜好信息

[0005]本专利技术描述的“一种基于课程关联性编码的个性化课程推荐系统及方法”利用学习者对历史课程产生的学习记录数据构建学习者的兴趣偏好,以及利用课程描述文本信息得到课程关联性进而产生课程的特征向量,通过刻画学习者的兴趣偏好与课程关联性解码得到课程的候选列表,以此提高推荐结果的学习者个性化和准确度

(三)
技术实现思路

[0006]本专利技术所要解决的是目前没有考虑课程关联性导致课程推荐精度低等问题,提供了一种基于课程关联性编码的个性化课程推荐系统及方法

[0007]本专利技术所采用的技术方案是:步骤一

从在线学习平台上获取学习者的历史注册课程记录,由于采集到的原始数据不能直接用于之后的计算,需要对采集到的原始数据进行数据的预处理,包括学习者
ID
,课程
ID
以及时间戳等;步骤二

利用爬虫工具采集的相关课程描述信息,主要为该课程的内容介绍,一定程度上表示课程的信息特征,并进行数据预处理将其转化为词词向量表示;步骤三

将学习者的历史注册课程记录输入到自动编码器神经网络
(AE)
中,即将历史注册课程记录表示为多热向量作为
AE
的输入,输出课程的向量表示;步骤四

获取学习者对不同历史课程的偏好程度,将步骤三得到的多热课程表示向量中添加自注意力系数作为
AE
编码,计算出学习者对历史注册学习课程的影响权重,通过添加注意力系数计算学习者对历史注册课程向量表示并进行加权和,进而得到学习者对历史课程的重要性向量;
步骤五

将步骤二对课程描述文本数据预处理获得的词向量表示输入到孪生长短时记忆神经网络
(Siamese LSTM)
中,输出最终课程的隐藏状态,对其添加注意力权重提取出课程之间的先决关系特征,预计算课程对的曼哈顿距离,得到课程关联性的预测结果;步骤六

将步骤五获得的课程关联性结果输入到
AE
中,作为自动解码器解码,最后输出得到学习者学习推荐课程的概率,将学习者对不同目标课程的预测概率从大到小排列,取前
K
个课程作为目标学习者的推荐课程列表

[0008]与现有技术相比,本专利技术具有如下优势:
[0009]本专利技术刻画学习者的兴趣偏好,由于无监督的自动编码器神经网络较好地处理无标签数据的问题,是一种隐式反馈来获取学习者的兴趣偏好的方法,因此将学习者历史注册课程的多热向量作为输入到自动编码器神经网络中

[0010]本专利技术通过添加自注意力系数进行自动编码器神经网络编码,能够很好地表示出学习者对每个历史课程中不同的重要性权重,即学习者对不同课程的兴趣偏好程度,从而保证了学习者画像的全面性与准确性

[0011]本专利技术引入课程关联性解码推荐,由于学习者在学习一门选修课程后,可能会继续学习与之相关性强的课程,以此拓展自身知识面,因此,通过课程描述内容信息来获得课程之间的相似度

[0012]本专利技术在刻画课程关联性时,使用了不同的权重系数与课程描述内容信息进行计算,该方法考虑了课程之间的先决关系条件,不同课程间的层次关系能够更好地提高课程推荐的可靠性和准确性

(四)附图说明
[0013]图1为课程推荐整体结构流程图

[0014]图2为数据采集和处理流程图

[0015]图3为自注意力编码流程图

[0016]图4为课程关联性生成流程图

[0017]图5为课程推荐产生流程图

(五)具体实施方式
[0018]为使本专利技术的目的

技术方案和优点更加清楚,以下结合具体实例,并参照附图,对本专利技术进一步详细阐述

[0019]本专利技术以在线学习平台课程推荐作为课程推荐的实例描述本专利技术方法具体实施过程

课程推荐的整体结构的流程如图1所示

[0020]具体包括以下步骤:步骤
1、
利用爬虫工具采集学习者历史注册课程记录和课程描述信息内容数据,并进行数据预处理;其中,课程描述信息是课程的主要内容介绍的文本描述,一定程度上表示了课程的特征信息;步骤
2、
根据学习者对不同历史课程注册学习记录,设置课程实体向量相对应的权重系数,从不同方面考虑课程对学习者的影响,获得学习者对课程的兴趣偏好向量;步骤
3、
使用数值向量表示赋予单词语义的方法将课程描述文本信息映射到特征
向量空间中,通过固定长度的零填充的单词索引序列,使课程描述信息转化成词向量的表示形式;步骤
4、
将步骤3的候选课程词向量对输入到孪生长短时记忆神经网络中,随时间更新其隐含状态,并添加注意力系数获取课程先决关系,使用曼哈顿距离预测出任意课程对的关联性;步骤
5、
利用步骤2中自注意力机制编码得到学习者兴趣偏好向量与步骤4获得的课程向量做预计算的课程关联性解码输入到自动编码器神经网络中,最终输出课程的推荐概率列表,对其进行排序优化得到课程推荐排序列表,将其推荐给目标学习者

[0021]图2显示的是本实例数据采集和处理的流程图,具体的步骤包含:步骤
1、
利用现有的网络爬虫技术,在学堂在线

慕课网等在线学习网站上爬取学习者的课程数据和课程描述信息,课程数据主要包括课程名本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
本发明公开了一种基于课程关联性解码的个性化课程推荐系统及方法,在用户偏好中进行知识感知实现推荐课程,其特征包含以下步骤:步骤一

从在线学习平台上获取学习者的历史注册课程记录,由于采集到的原始数据不能直接用于之后的计算,需要对采集到的原始数据进行数据的预处理,包括学习者
ID
,课程
ID
以及时间戳等;步骤二

利用爬虫工具采集的相关课程描述信息,主要为该课程的内容介绍,一定程度上表示课程的信息特征,并进行数据预处理将其转化为词词向量表示;步骤三

将学习者的历史注册课程记录输入到自动编码器神经网络
(AE)
中,即将历史注册课程记录表示为多热向量作为
AE
的输入,输出课程的向量表示;步骤四

获取学习者对不同历史课程的偏好程度,将步骤三得到的多热课程表示向量中添加自注意力系数作为
AE
编码,计算出学习者对历史注册学习课程的影响权重,通过添加注意力系数计算学习者对历史注册课程向量表示并进行加权和,进而得到学习者对历史课程的重要性向量;步骤五

将步骤二对课程描述文本数据预处理获得的词向量表示输入到孪生长短时记忆神经网络
(Siamese LSTM)
中,输出最终课程的隐藏状态,对其添加注意力权重提取出课程之间的先决关系特征,预计算课程对的曼哈顿距离,得到课程关联性的预测...

【专利技术属性】
技术研发人员:刘铁园周如鹏常亮
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1