【技术实现步骤摘要】
一种基于大数据的课堂教学评测方法及系统
[0001]本专利技术涉及数据处理
,具体涉及一种基于大数据的课堂教学评测方法及系统
。
技术介绍
[0002]网络课堂作为在线教育中连接师生的重要媒介,已经作为一种新兴的教育手段在教学领域上有了一定范围的普及
。
网络课堂的发展及其有效性建设对于教育学领域来说具有相当重要的影响,并且网络课堂教育的发展无论从规模上还是从水平上在近年来都呈现出逐步上升的趋势
。
在授课时,课堂的活跃程度都是影响一节课堂教学质量的重要因素,而在网络课堂,学生可以通过在特定聊天窗口以弹幕的形式进行讨论等操作,由于在输入弹幕时需要键入内容,无形中增加了成本,因此网络课堂讨论的活跃程度可以更加明显地反映学生在课堂上的积极性
。
[0003]在现有技术中,
simHash
算法是一种用于文档相似度计算的近似近邻搜索算法,但是该算法在算法运行过程中对分词后的词语权重的量化是通过全局频率,而忽略了局部上下文信息对分词权重的影响,导致无法捕捉 ...
【技术保护点】
【技术特征摘要】
1.
一种基于大数据的课堂教学评测方法,其特征在于,该方法包括以下步骤:将教师授课音频数据和学生互动内容分别转化为第一文字数据序列和第二文字数据序列,所述第一文字数据序列和第二文字数据序列中包含若干时序标签;根据第一文字数据序列和第二文字数据序列中时序标签的分词对第一文字数据序列和第二文字数据序列进行拆分,获得第一拆分数据和第二拆分数据;根据第一拆分数据和第二拆分数据中数据的变化分别获得第一拆分数据和第二拆分数据中每个时间间隔作为分割点的可能性,所述时间间隔是指相邻时序标签的时间间隔,根据分割点的可能性将第一拆分数据与第二拆分数据分别划分为多段文本数据;根据多段文本数据中不同分词的种类数与相邻文本数据中分词出现的次数分别获得第一拆分数据与第二拆分数据中每一个分词的权重,根据每一个分词的权重和第一拆分数据的多段文本数据与第二拆分数据的多段文本数据在文本内容上的关系获得每一个分词的总权重;根据每一个分词的总权重获得每一段文本数据的海明距离;根据每一段文本数据的海明距离获得课堂质量评价值;根据课堂评价值对课堂教学作出评测
。2.
根据权利要求1所述的一种基于大数据的课堂教学评测方法,其特征在于,所述将教师授课音频数据和学生互动内容分别转化为第一文字数据序列和第二文字数据序列,所述第一文字数据序列和第二文字数据序列中包含若干时序标签,包括的具体步骤如下:利用
HMM
语音识别算法将老师的语音数据转换为对应文字数据,记为第一文字数据,所述学生互动内容包括学生发送弹幕互动的文字数据,将学生发送弹幕互动的文字数据记为第二文字数据;对提取到的文字加入时间标签,其记录方式如:,式中,表示时间戳,表示时间戳对应的授课内容文字,简记为时序标签;然后由所有的时序标签组成第一文字数据序列;获得学生发送弹幕互动的文字数据的时序标签,组成第二文字数据序列
。3.
根据权利要求1所述的一种基于大数据的课堂教学评测方法,其特征在于,所述对第一文字数据序列和第二文字数据序列进行拆分,获得第一拆分数据和第二拆分数据,包括的具体步骤如下:使用语言模型的分词方法对第一文字数据序列中的每一个时序标签进行分词,时序标签的所有分词构成第一文字数据序列的拆分文字序列,记为第一拆分数据;获得第二文字数据序列的拆分文字序列,记为第二拆分数据
。4.
根据权利要求1所述的一种基于大数据的课堂教学评测方法,其特征在于,所述根据第一拆分数据和第二拆分数据中数据的变化分别获得第一拆分数据和第二拆分数据中每个时间间隔作为分割点的可能性,所述时间间隔是指相邻时序标签的时间间隔,根据分割点的可能性将第一拆分数据与第二拆分数据分别划分为多段文本数据,包括的具体步骤如下:式中,表示第个时间间隔是时间分割点的可能性;表示在第一拆分数据中每一个
拆分数据的时间长度,单位为秒;表示时间间隔总数;获得第一拆分数据中所有可能的时间分割点,当时,表示该时间间隔作为分割点,为预设阈值;通过每个分割点将第一拆分数据的时序标签在时间层面进行拆分,获得第一拆分数据的多段文本数据获得第二拆分数据的多段文本数据
...
【专利技术属性】
技术研发人员:王勋达,
申请(专利权)人:山东十二学教育科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。