基于卷积神经网络的慕课论坛主题分类方法技术

技术编号:19512202 阅读:34 留言:0更新日期:2018-11-21 08:19
本发明专利技术公开了一种基于卷积神经网络的慕课论坛主题分类方法,包括:对慕课论坛用户的行为进行记录并手工设计抽取相应的用户行为数据特征,使用卷积神经网络不断学习上述手工设计的用户行为特征,得到更高层次的更具判别力的用户行为特征表示,然后利用该特征对慕课论坛的主题进行分类,提高慕课论坛主题划分的效果。本发明专利技术方法使用卷积神经网络自动学习和抽象手工设计的论坛用户行为数据特征,获得更具判别力的慕课论坛主题分类特征,提高了慕课论坛主题分类的效果并可以减少用户手工设计、筛选用户行为特征的困难。

【技术实现步骤摘要】
基于卷积神经网络的慕课论坛主题分类方法
本专利技术涉及数据挖掘领域,尤其涉及一种基于卷积神经网络的慕课论坛主题分类方法。
技术介绍
大型在线课程(Massiveopenonlinecourse,慕课)的兴起使得教育大数据挖掘成为了热门且困难的数据挖掘研究方向之一,慕课论坛主题是在线课程用户关于课程发表提出的问题,自动准确地对论坛主题进行分类一直是提高在线教育课程质量的关键之一。多语种,多学科的慕课论坛主题讨论内容使得基于自然语言处理的数据挖掘技术失效。不同类别主题的用户行为特征具有很大的差别。如关于作业的主题,其讨论帖的发表速度,浏览次数以及得到赞的个数都和关于交友的主题差异很大,因此可以手工设计不同主题的用户行为特征作为慕课论坛主题分类的特征输入。但是用户行为特征的设计和筛选都极其困难,需要对慕课论坛的主题用户的行为极其熟悉且具备相当强的数据分析能力,才能设计出一个良好的用户行为特征。深度学习尤其是卷积神经网络表现出了从原始特征学习出更加复杂抽象且具备良好判别力特征的能力,因此本专利技术利用卷积神经网络降低用户行为特征设计和筛选的困难,自动学习到更好的用户行为特征的表示,从而提升慕课论坛主题分类的效果。
技术实现思路
本专利技术实施例提供一种基于卷积神经网络的慕课论坛主题分类方法,该方法利用卷积神经网络不断从原始用户行为特征学习出更加复杂和具备判别力的用户行为特征,提升了慕课论坛主题分类的效果和减轻了用户行为特征设计、筛选的困难。本专利技术提供的基于卷积神经网络的慕课论坛主题分类方法,包括以下步骤:步骤S101:收集并记录慕课论坛用户的行为数据,手工设计一定量原始用户行为特征;步骤S102:利用卷积神经网络组合抽象手工设计的原始用户行为特征,并且定义最终神经网络需要优化的目标函数;步骤S103:通过反向传播算法学习得到每一层网络参数的权重,从而得到一个判别性强且抽象的用户行为特征表示,使用逻辑回归算法和该特征对慕课论坛主题进行分类。优选的,所述步骤S102,利用卷积神经网络学习得到比原始论坛用户行为特征更加抽象的表示。优选的,利用卷积神经网络不断组合原始论坛用户行为特征,并且定义最终神经网络需要优化的目标函数;首先给定慕课论坛主题的原始用户行为特征X和标签Y,以及卷积神经网络F(W,X),可以得到原始用户行为特征X的抽象表示Xconv,主题的标签预测结果其目标函数L如下公式所示:其中argmin表示求取该目标函数的最小值,s.t.表示目标函数的约束。通过使用反向传播算法不断迭代优化目标函数,得到该目标函数一个较优的解;反向传播一般使用随机梯度下降算法,目标函数L是非凸函数,随机梯度下降算法可以不断更新神经网络的参数W,从而获得原始用户行为特征X的一个较优的抽象表示Xconv。优选的,所述步骤S103:通过反向传播学习得到神经网络的权值W,从而得到原始用户行为特征X的一个较优的抽象表示Xconv,使用Xconv和相应的机器学习分类算法如逻辑回归,支持向量机等可以对慕课论坛主题进行良好地分类;卷积神经网络通过使用卷积操作,不断将上一层的特征做进一步的组合和激活,使得新生成的特征具备更高的抽象和判别能力;相应的操作表示为:其中Wi为卷积神经网络每一层的权重,fi为每一层的激活函数,定义为:f(x)=max(0,x)。有益效果:一般的卷积神经网络的特征抽象模块都包含卷积操作和池化操作,池化操作对于图像的识别非常有利,因为它通过一个简单的求最大或者求平均的运算在降低参数量的同时扩大卷积神经网络的感受野,且获得对于平移和旋转不变的特性。本方法利用卷积神经网络做慕课论坛主题分类,和图像识别有巨大的差异,因此在本方法中取消了卷积神经网络中池化操作的设计。与普通的全连接神经网络相比,卷积神经网络每一层神经元的权值都是共享的,因此可以较好地避免由于参数过多带来的过拟合的问题。附图说明图1为本专利技术基于卷积神经网络的慕课论坛主题分类方法流程图。图2为本专利技术基于卷积神经网络的慕课论坛主题分类方法的具体实施例图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。在慕课论坛用户行为数据记录以及原始用户行为特征数据设计时,记录并选取了16种用户行为特征,它们分别关注了慕课论坛主题的结构,主题的潜在社会网络,主题的流行程度以及主题的质量4个方面的特征,基本覆盖了用户行为特征的各个方面。16种用户行为特征的分别是:如图1所示,本专利技术提出的基于卷积神经网络的慕课论坛主题分类方法,主要包括:首先收集并记录慕课论坛用户的行为数据,手工设计一些原始的用户行为特征。其次,利用卷积神经网络组合抽象手工设计的原始用户行为特征,并且定义最终神经网络需要优化的目标函数。最后,通过反向传播算法不断更新每一层网络参数的权重,学习得到一个判别性强且抽象的用户行为特征表示,使用逻辑回归算法和该特征对慕课论坛主题进行分类。所述卷积神经网络的模型可以表示为:图2所示,本实施例的基于卷积神经网络的慕课论坛主题分类方法方法,包括:步骤201、收集并记录慕课论坛用户的行为数据,手工设计一些原始的用户行为特征。步骤202、对数据进行缺失值替换,异常数据剔除等预处理,并利用SMOTE算法对少数类的样本进行过采样处理,保持样本分布平衡。步骤203、设计卷积神经网络结构,并且定义最终神经网络需要优化的目标函数L:步骤204、通过反向传播算法不断优化目标函数L,更新卷积神经网络每一层的权重W,其更新公式为:步骤205、利用训练好的卷积神经网络得到抽象的用户行为特征的表示Xconv,可以通过以下公式计算:Xconv=F(W,X)其中F(.)表示相应的卷积神经网络的配置。步骤206、将得到的抽象用户行为特征作为逻辑回归分类器的输入,调整分类器参数,得到最优的训练集样本分类效果。步骤207、使用逻辑回归分类器对实际的在线慕课论坛主题进行分类,并根据分类的效果不断优化迭代逻辑回归模型。本实施例,通过利用卷积神经网络能够不断将原始特征进行组合抽象,得到更具判别力的复杂特征的能力,从原始的慕课论坛主题的用户行为特征学习到更优的用户行为特征的表示,从而提升慕课论坛主题分类的效果,并且减少手工设计、选择用户行为特征的困难,提升大型在线课程的教学质量和用户体验。最后应说明的是:以上各实施例仅用以说明本专利技术的技术方案,而非对其限制;尽管参照前述各实施例对本专利技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本专利技术各实施例技术方案的范围。本文档来自技高网...

【技术保护点】
1.一种基于卷积神经网络的慕课论坛主题分类方法,包括以下步骤:步骤S101:收集并记录慕课论坛用户的行为数据,手工设计一定量原始用户行为特征;步骤S102:利用卷积神经网络组合抽象手工设计的原始用户行为特征,并且定义最终神经网络需要优化的目标函数;步骤S103:通过反向传播算法学习得到每一层网络参数的权重,从而得到一个判别性强且抽象的用户行为特征表示,使用逻辑回归算法和该特征对慕课论坛主题进行分类。

【技术特征摘要】
1.一种基于卷积神经网络的慕课论坛主题分类方法,包括以下步骤:步骤S101:收集并记录慕课论坛用户的行为数据,手工设计一定量原始用户行为特征;步骤S102:利用卷积神经网络组合抽象手工设计的原始用户行为特征,并且定义最终神经网络需要优化的目标函数;步骤S103:通过反向传播算法学习得到每一层网络参数的权重,从而得到一个判别性强且抽象的用户行为特征表示,使用逻辑回归算法和该特征对慕课论坛主题进行分类。2.根据权利要求1所述基于卷积神经网络的慕课论坛主题分类方法,其特征在于,所述步骤S102,利用卷积神经网络学习得到比原始论坛用户行为特征更加抽象的表示。3.根据权利要求2所述基于卷积神经网络的慕课论坛主题分类方法,其特征在于,利用卷积神经网络不断组合原始论坛用户行为特征,并且定义最终神经网络需要优化的目标函数;首先给定慕课论坛主题的原始用户行为特征X和标签Y,以及卷积神经网络F(W,X),得到原始用户行为特征X的抽象表示Xconv,主题...

【专利技术属性】
技术研发人员:刘胜蓝冯林王飞龙刘国超
申请(专利权)人:大连理工大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1