【技术实现步骤摘要】
联合文本分类和序列标注的课堂行为分类方法及装置
[0001]本申请实施例涉及课堂行为分类
,尤其涉及一种联合文本分类和序列标注的课堂行为分类方法及装置。
技术介绍
[0002]我国课堂教学改革正在进入促进学生深度学习的阶段,不仅需要对教学的外在形式如自主合作探究的实效性进行评价,而且需要对课堂教学占据最多时间的教学语言的效果进行分析,评价教学语言在促进学生自主参与、高级思维能力发展的实效。美国学者弗兰德斯指出,课堂教学活动中教师和学生主要依靠语言来进行交流,语言行为占到总体课堂教学行为的80%。然而,传统的教学语言分析已经无法满足如今在线课堂背景下教育领域的需求。在传统的教学语言分析当中,教学语言需要人工进行记录,并在之后进行手动的编码和标注。而如今,我们可以利用人工智能当中的语音识别和自然语言处理技术代替这个过程,在更为高效和精确的信息化技术的赋能下,对在线课堂以至于其它课堂录像之中的课堂语言信息进行切分、识别、归类、编码和统计,并以此为基础对新老教师的课堂提供客观、翔实、全局性的教学评价。但是现有的课堂教学分析技术 ...
【技术保护点】
【技术特征摘要】
1.一种联合文本分类和序列标注的课堂行为分类方法,其特征在于,所述方法包括以下步骤:获取教学视频数据并对其进行语音转写,形成初始语料;对所述初始语料进行预处理后获得篇章数据,将所述篇章数据输入到无监督预训练模型进行增量预训练;构建文本分类和序列标注的联合损失函数对所述篇章数据进行训练,利用有监督预训练模型对所述篇章数据进行预测,得出教学行为分类标签矩阵;对所述教学行为分类标签矩阵进行分析,得到联合文本分类和序列标注的课堂行为分类。2.根据权利要求1所述的联合文本分类和序列标注的课堂行为分类方法,其特征在于,所述将所述篇章数据输入到无监督预训练模型进行增量预训练之前,还包括:构建句子级的对比学习样本,通过softmax分类器对该对比学习样本进行三类损失函数预测并相加,得到NSP任务的总体损失函数:L
cNSP
=αL
NSP
+βL
PSP
+σL
RSP
;;;其中,L
cNSP
为经过对比学习方法改进之后的NSP任务的总体损失函数;L
NSP
、L
PSP
和L
RSP
为cNSP任务下的三个子任务的损失函数;α、β和σ为三个子任务在总损失函数中对应的权重系数;h为在不同子任务下神经网络隐层最后一层的输出;softmax()代表使用softmax函数进行归一化处理,并计算结果的交叉熵损失;构建词语级对比学习样本,词语级任务的损失函数为:其中,L
cMLM
表示经过对比学习之后MLM任务的总体损失函数,θ表示模型的参数集,k表示每个被打乱的子序列的长度,pos代表Bert模型输入当中规定词语位置的position embedding。3.根据权利要求2所述的联合文本分类和序列标注的课堂行为分类方法,其特征在于,所述将所述篇章数据输入到无监督预训练模型进行增量预训练,包括:无监督训练阶段的损失函数为:L=η1L
cNSP
+η2L
cMLM
;其中,η1和η2为子任务对应的权重系数;将所述篇章数据输入到无监督训练阶段的损失函数中,以完成增量训练。4.根据权利要求1所述的联合文本分类和序列标注的课堂行为分类方法,其特征在于,所述构建文本分类和序列标注的联合损失函数对所述篇章数据进行训练,包括:序列标注任务当中,使用Bi
‑
LSTM+CRF的模型结构来完成此任务,因此该阶段的损失函数由CRF产生,序列标注任务的损失函数为:
y
st
=CRF(H
st
);其中,H
st
为经过Bert编码之后得到的[CLS]序列,CRF()代表对H
st
后接一个条件随机场进行处理,由此得到y
st
;文本分类任务的损失函数:其中,W
...
【专利技术属性】
技术研发人员:林晓,沈锴成,阙维俏,李岩,王龚,张波,
申请(专利权)人:上海师范大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。