【技术实现步骤摘要】
一种融合内容和图结构信息的慕课推荐算法
[0001]本专利技术涉及一种融合内容和图结构信息的慕课推荐算法,尤其是一种融合内容和图结构信息的慕课推荐算法。
技术介绍
[0002]慕课(MOOC)逐渐成为一种成熟的在线和远程教育方式,例如Coursera、 edX和Udacity这三大慕课平台为数百万用户提供了国际知名大学的众多课程。在中国,学堂在线(XuetangX)已提供1000余门课程,全球用户超过600万,是中国最大的慕课平台之一。线上教育是未来教育发展的一个必然趋势,更加凸显了线上学习的意义和重要性。慕课平台中课程种类繁多,课程推荐作为系统地指导用户学习的主要方式,如何让拥有不同学习背景的用户找到感兴趣的课程并捕捉用户随时间变化的动态兴趣实现精准的个性化推荐是目前一个具有挑战性的问题;
[0003]现有的课程推荐算法主要基于内容或协同过滤完成推荐,这些方法直接根据用户与课程之间的历史交互信息或用户与课程自身的内容信息向用户推荐课程会忽略不同用户的专业水平,可解释性不强。此外,仅使用单层面特征信息往往不能充分挖掘用户与课程之间的潜在关系,对推荐的准确性有很大影响。
技术实现思路
[0004]本专利技术需要解决的技术问题是提供一种融合内容和图结构信息的慕课推荐算法,针对
技术介绍
提到的问题,从文本内容和异构图结构信息两个层面挖掘用户与课程之间的复杂非线性关系,加强推荐的可解释性并提高推荐的准确性。
[0005]为解决上述技术问题,本专利技术所采用的技术方案是:一种融合内容和图结构信息的 ...
【技术保护点】
【技术特征摘要】
1.一种融合内容和图结构信息的慕课推荐算法,其特征在于:包括如下步骤:步骤S1、数据预处理,构建GEMRec模型和CNNMRec模型的输入数据;步骤S2、将邻接矩阵集合A输入到GEMRec模型,得到用户图嵌入向量和课程图嵌入向量;步骤S3、将用户图嵌入向量、课程图嵌入向量、用户词嵌入向量和课程词嵌入向量输入到CNNMRec模型,输出用户学习与课程之间的交互概率;步骤S4、训练时,使用二分类交叉熵损失函数,通过梯度下降法减小损失,推荐时,计算用户与所有候选课程的余弦相似度,为用户推荐相似度最大的前K门课程。2.根据权利要求1所述的一种融合内容和图结构信息的慕课推荐算法,其特征在于:所述步骤S1的具体步骤如下:步骤S11、利用用户、课程和知识概念构造用包含单位矩阵I的邻接矩阵集合A表示的异构信息网络;步骤S12、去掉课程介绍文本中的HTML标签和首尾的转义字符,用[UNK]标记替换文本中间的转义字符,长度超过512个字符的文本在第510个字符后进行截断;步骤S13、将处理后的课程介绍输入到预训练模型BERT中,在输出层取[CLS]标记对应的特征向量作为该课程的词嵌入向量;步骤S14、对用户学习过的课程序列中的每一门课程的词嵌入向量加权求和得到用户词嵌入向量,使用指数衰减法为课程分配权重,公式如下:其中,表示用户u
i
的词嵌入向量,表示用户u
i
学习的课程数量,t表示用户学习的第t门课程,表示第t门课程的词嵌入向量,表示用户最新学习的课程。3.根据权利要求2所述的一种融合内容和图结构信息的慕课推荐算法,其特征在于:所述步骤S2的具体步骤如下:步骤S21、邻接矩阵集合A输入到包含两个并行多通道1
×
1卷积神经网络的MG子层生成元路径邻接矩阵;步骤S22、将图卷积网络应用于元路径邻接矩阵A
(l)
∈R
N
×
N
×
C
的每个通道,并将每个节点不同通道的表征进行拼接,公式如下:其中,||是拼接操作符,C表示通道数,σ为Sigmoid激活函数,是第i个通道带自连接的元路径邻接矩阵,是的度矩阵,W∈R
d
×
d
是跨通道共享的可训练权重矩阵,X∈R
N
×
d
是特征矩阵,Z包含了来自C个不同元路径图的节点表征,每个元路径邻接矩阵的长度不一样;步骤S23、将Z中的用户表征作为状态输入到强化学习模型Policy Gradient中,通过最
大化得到的奖励更新异构信息网络,从而更新图中的节点表征,最终得到用户和课程的图嵌入向量。4.根据权利要求3所述的一种融合内容和图结构信息的慕课推荐算法,其特征在于:所述步骤S21的具体步骤如下:步骤S211、利用多通道1
×
1卷积从邻接矩阵集合A中软选择两个邻接矩阵Q1、Q2,公式如下:其中,φ是卷积层,W
φ
∈R1×1×
K
是φ的参数,T
e
表示边类型的集合,是边类型t
i
在第l个MG子层的权重,是边类型t
i
对应的邻接矩阵;步骤S212、根据软选择的两个邻接矩阵通过矩阵乘法Q1*Q2计算元路...
【专利技术属性】
技术研发人员:宫继兵,王成,方小涵,黄朝园,赵祎,丛方鹏,
申请(专利权)人:燕山大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。