一种学生教学评价领域情感词典的构建方法技术

技术编号:38772511 阅读:15 留言:0更新日期:2023-09-10 10:45
本发明专利技术属于情感分析领域,并公开了一种学生教学评价领域情感词典的构建方法,包括:获取通用情感词典,构建否定词表和程度副词表;基于否定词表和程度副词表对通用情感词典进行扩建;获取学生教学评价数据,对学生教学评价数据进行预处理,预处理完成后通过TextRank算法对学生教学评价数据进行分析筛选,得到情感种子词,并通过SO

【技术实现步骤摘要】
一种学生教学评价领域情感词典的构建方法


[0001]本专利技术属于情感分析领域,特别是涉及一种学生教学评价领域情感词典的构建方法。

技术介绍

[0002]在国内教育数字化进程的推进过程中,学生评教成为教学改革之路上重要的一步,目前引起了广泛的关注。学生教学评价是一种收集学生对课程教学质量反馈信息的方法,能够很好地反映学生对课程的满意度,同时能帮助教师有针对性地改进教学。通过分析高校学生评教中存在的问题并找出相应的解决方案,对促进教师改进教学、保证学生的学习利益有着重要的现实意义。因此,从学生教学评价中分析其中蕴含的情感状态有重要的价值。
[0003]情感词典的构建方法通常包含三种:手工标注的方法、基于知识库的方法和基于语料库的方法。人工构建的情感词典虽然具有较好的通用性,但是难以覆盖不同领域的情感词,领域适应性差,需耗费大量人力物力;基于知识库的方法通常只能获得通用情感词典,存在领域适应性问题;基于语料库的情感词典构建方法可以从语料中学习得到情感词典,能够节省大量人力物力。基于语料库的方法假设:具有相同情感倾向性的情感词容易出现在同一句子中,通常需要事先手工标注一小部分情感种子词,然后通过情感词与情感种子词在语料中共现关系的强度来估算待判断情感词的情感极性。
[0004]学生教学评价数据是学生对该课程以及该任课老师的评价,与商品评论不同的是,学生教学评价所表达的情感更加隐晦,其情感特征的提取也会相对困难,例如在商品评论中表达的对某商品的消极情绪可能会特别直接,然而学生对教师的教学效果持有负面评论时的表述会相对委婉,这使得复杂的情感特征难以提取。

技术实现思路

[0005]本专利技术的目的是提供一种学生教学评价领域情感词典的构建方法,以解决上述现有技术存在的问题。
[0006]为实现上述目的,本专利技术提供了一种学生教学评价领域情感词典的构建方法,包括:
[0007]获取通用情感词典,基于所述通用情感词典的情感数据构建否定词表和程度副词表;
[0008]基于所述否定词表和所述程度副词表对所述通用情感词典进行扩建,得到扩建后的通用情感词典;
[0009]获取学生教学评价数据,对所述学生教学评价数据进行数据预处理,数据预处理完成后通过TextRank算法对所述学生教学评价数据进行分析筛选,得到情感种子词,通过SO

PMI算法对所述情感种子词进行分析,得到基于用户的教学领域情感词,对所述教学领域情感词的情感倾向值进行归一化处理,得到归一化处理后的教学领域情感词;
[0010]对所述归一化处理后的教学领域情感词与所述扩建后的通用情感词典进行合并,得到学生教学评价领域情感词典。
[0011]可选的,所述情感数据包括情感词以及所述情感词的情感强度数据和情感极性数据。
[0012]可选的,所述构建否定词表和程度副词表的过程包括:
[0013]获取通用情感词典的否定词数据和程度副词数据,对所述情感词和否定词进行分析判断,基于判断结果构建所述否定词表;
[0014]对所述程度副词数据进行分级,通过梯度下降公式对分级结果进行加权,得到程度副词数据的分级权重数据,基于所述分级权重数据构建所述程度副词表。
[0015]可选的,所述学生教学评价数据包括:评教文本数据和教学打分数据。
[0016]可选的,所述对所述学生教学评价数据进行数据预处理的过程包括:
[0017]获取中文分词库数据和停用词典数据,通过正则表达式对所述评教文本数据中的中英文符号以及其余无用信息进行数据清洗;
[0018]基于所述中文分词库数据对数据清洗完成后的评教文本数据进行分词,分词完成后通过调用所述停用词典数据对所述评教文本数据进行去停用词操作。
[0019]可选的,获取情感种子词的过程包括:
[0020]通过TextRank算法对所述学生教学评价数据中的情感词进行循环迭代计算,计算完成后按重要程度将计算结果从高到低进行排序,得到若干积极情感种子词和消极情感种子词。
[0021]可选的,通过SO

PMI算法获取情感倾向值的计算公式为:
[0022][0023][0024]其中,Pterm
i
为第i个积极情感种子词,Nterm
i
为第i个消极情感种子词。
[0025]可选的,获取学生教学评价领域情感词典的过程包括:
[0026]对所述情感倾向值归一化处理:
[0027][0028]其中,y为情感种子词经过归一化处理后的情感倾向值,SP为情感种子词的情感倾向值,SPmax为候选情感种子词当中情感倾向值的最大值,SPmin为情感种子词当中情感倾向值的最小值;
[0029]将归一化处理后的教学领域情感词与扩建后的通用情感词典进行合并,完成学生教学评价领域情感词典的构建。
[0030]本专利技术的技术效果为:
[0031]本专利技术提供的一种学生教学评价领域情感词典的构建方法利用梯度下降公式赋予不同强度的程度副词不同的权重值构建了程度副词表,基于否定词判断构建了否定词
表,增加了程度副词和否定词表的通用情感词典可以更为精准地分析教学评语中的情感变化;
[0032]其次挖掘了基于用户的领域情感词汇,通过TextRank算法选取情感种子词,并基于情感种子词利用SO

PMI算法生成基于用户的教学领域情感词汇,增强了模型的泛化性和情感分类的准确度;最后生成学生教学评价领域情感词典,将基于用户的领域情感词并入到扩建的通用情感词典中,生成的学生教学评价领域情感词典在评教情感分析上具有更好的效果,提高了情感识别的准确性,对评教领域具有现实意义。
附图说明
[0033]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0034]构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0035]图1为本专利技术实施例中的流程图。
具体实施方式
[0036]现详细说明本专利技术的多种示例性实施方式,该详细说明不应认为是对本专利技术的限制,而应理解为是对本专利技术的某些方面、特性和实施方案的更详细的描述。
[0037]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0038]实施例一
[0039]如图1所示,本实施例中提供了一种学生教学评价领域情感词典的构建方法,包括:获取通用情感词典,基于所述通用情感词典的情感数据构建否定词表和程度副词表;基于所述否定词表和所述程度副词表对所述通用情感词典进行扩建,得到扩建后的通用情感词典;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种学生教学评价领域情感词典的构建方法,其特征在于,包括:获取通用情感词典,基于所述通用情感词典的情感数据构建否定词表和程度副词表;基于所述否定词表和所述程度副词表对所述通用情感词典进行扩建,得到扩建后的通用情感词典;获取学生教学评价数据,对所述学生教学评价数据进行数据预处理,数据预处理完成后通过TextRank算法对所述学生教学评价数据进行分析筛选,得到情感种子词,通过SO

PMI算法对所述情感种子词进行分析,得到基于用户的教学领域情感词,对所述教学领域情感词的情感倾向值进行归一化处理,得到归一化处理后的教学领域情感词;对所述归一化处理后的教学领域情感词与所述扩建后的通用情感词典进行合并,得到学生教学评价领域情感词典。2.根据权利要求1所述的构建方法,其特征在于,所述情感数据包括情感词以及所述情感词的情感强度数据和情感极性数据。3.根据权利要求1或2所述的构建方法,其特征在于,所述构建否定词表和程度副词表的过程包括:获取通用情感词典的否定词数据和程度副词数据,对所述情感词和否定词进行分析判断,基于判断结果构建所述否定词表;对所述程度副词数据进行分级,通过梯度下降公式对分级结果进行加权,得到程度副词数据的分级权重数据,基于所述分级权重数据构建所述程度副词表。4.根据权利要求1

3任一项所述的构建方法,其特征在于,所述学生教学评价数据包括:评教文本数据和教学打分数据。5.根据权利要求1

4任一项所述的构建方法,其特征在于,所述对所述学...

【专利技术属性】
技术研发人员:郭鸿杰黄显之张尧陈丽娜沈方瑶高宏
申请(专利权)人:浙江师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1