一种基于修辞使用的小学语文作文自动评价方法技术

技术编号:22467647 阅读:39 留言:0更新日期:2019-11-06 11:28
本发明专利技术属于教育信息化领域,提供一种基于修辞使用的小学语文作文自动评价方法,首先,实现作文基础评分特征的识别与自动抽取,然后获取修辞类评分特征。将四类作文作为选取评价器的参考因素,得到一个适用于各类作文类别的评价器。最后,得到基于各个评分特征的评价结果信息,供写作者参考改进。本发明专利技术一种基于修辞使用的小学语文作文的自动评价方法,能够实现基础教育阶段作文自动化评测。

An automatic evaluation method of primary school Chinese composition based on Rhetoric

【技术实现步骤摘要】
一种基于修辞使用的小学语文作文自动评价方法
本专利技术属于教育信息化领域,具体涉及一种基于修辞使用的小学语文作文自动评价方法。
技术介绍
语文课程标准明确指出,作文教学是语文教学中的重要组成部分。作文是体现小学生语文综合运用能力的主要方面之一,学生的作文撰写能力在一定程度上是语文综合能力的体现。教育部发布的《教育信息十年发展规划》中强调以教育信息化带动教育现代化的基本策略。因此,将信息技术应用于作文教学之中,辅助师生的教与学显得尤为重要。立足于教育信息化辅助作文教学需求,作文的自动化评价已成为当前技术热点。在小学语文作文的评价标准中,作文中修辞手法的运用是作文评价的重要依据。随着人工智能技术的快速发展,目前已有一些技术能够支持作文的自动评分。但主要集中于对英文作文的自动评分,少数针对语文高考作文的自动评分。并且,所使用的语义特征较为基础,既没有利用作文的修辞信息,也没有进行文本分类。
技术实现思路
本专利技术的目的在于构建一种适用于基础教育阶段的作文辅助评测的信息化机制,提供一种基于修辞使用的小学语文作文自动评价方法,实现基础教育阶段作文自动化评测。本专利技术是通过以下技术方案实现的。一种基于修辞使用的小学语文作文自动评价方法,包括以下步骤:(1)获取浅层次语义特征;浅层次语义特征是指例如作文中好词的使用、作文长度、段落数等作文浅层次的特征。利用Python脚本语言中的Sigmoid()函数获取作文长度。利用jieba分词获取好词,例如:成语词、叠词等。通过对浅层次语义特征的抽取,并将其与作文得分进行相关性分析,获取最终的基础评分特征。(2)基础评分特征的自动提取;将获取到的基础评分特征借助Python语言进行自动提取。利用Python语言中的Sigmoid()函数实现对作文长度的自动提取;利用jieba分词获取作文的好词;利用分隔符“\n”以及Python语言中的len()函数获取作文的段落数。(3)获取修辞类评分特征;选择在小学作文中常见的四类特征作为修辞类评分特征,分别是:排比句、比喻句、拟人句以及引用句。通过Pearson相关性分析,得到四类特征与作文得分的相关性关系。确定以此四类修辞特征作为修辞类评分特征的有效性。(4)构建作文自动评分器,结合基础评分特征及修辞类评分特征,构建作文自动评分器。(5)判断作文类型;鉴于小学作文的文体形式多样,作文类型的不同,会对评分器的性能产生影响。将当前小学语文作文中的四类主要作文考虑进来,辅助最优评分器的选择。四类作文主要为写景类、写物类、写人类和记事类。(6)确定最优的作文自动评价器;通过比较不同类型作文下,各个评分器的性能,得到适合于各个作文类别的分类器。利用该分类器,比较基础评分特征和加入了修辞特征后的自动评分结果,验证本专利技术中选择的作文自动评分器的有效性。在上述技术方案中,还包括以下步骤:(7)自动生成个性化评语;结合各评分特征,在评分器对作文进行评价的同时,生成个性化的语言评价信息,供写作者参考改进。本专利技术提出的一种基于修辞使用的小学语文作文自动评价方法,首先,实现作文基础评分特征的识别与自动抽取,然后获取修辞类评分特征。鉴于最后得到的自动评分器会因作文类别不同而效果不同,因此,将四类作文作为选取评价器的参考因素,得到一个适用于各类作文类别的评价器。最后,得到基于各个评分特征的评价结果信息,供写作者参考改进。至此,生成一种基于修辞使用的小学语文作文的自动评价方法,实现基础教育阶段作文自动化评测。附图说明图1为本专利技术基于修辞使用的小学语文作文自动评价方法的流程图。具体实施方式下面将结合实施案例参照附图进行详细说明,以便对本专利技术的目的,特征及优点进行更深入的理解。如图1所示,本专利技术实施提供了一种基于修辞使用的小学语文作文自动评价方法,包括以下步骤:(1)基础评分特征提取。目前已有的作文自动评分平台并没有获取到作文的内容,而是通过一些浅层次语义特征如作文字数、段落划分、好词数等进行评价。鉴于这些特征所包含的潜在信息与作文评价的某些要求相关,故将这些特征纳入为作文评价的特征之中,称这些浅层次语义特征为基础评分特征。S1,基础评分特征的选择;利用教育大数据,得到如下表所示的浅层次语义特征。利用数据分析工具SPSS,分别得到这些语义特征与作文得分之间的相关性,最后选取相关性最高的特征作为基础评分特征。特征描述作文长度作文的字数平均句长句子的平均长度好词数特定词的个数段落数作文的段落数平均段长每段的平均长度最长段长最长段落的字数最短段长最短段落的字数利用Python脚本语言中的Sigmoid()函数获取作文长度;利用jieba分词和自建词典获取好词,例如:成语词、叠词等。通过对浅层次语义特征进行抽取,并将其与作文得分进行Pearson相关性分析,选取相关性最高的三项指标为基础评分特征,如下表所示。待评分特征Pearson相关系数作文长度0.838好词数0.474段落数0.411S2,基础评分特征的抽取;确定了基础评分特征后,利用Python脚本语言实现特征的自动抽取。利用Python语言中的Sigmoid()函数获取作文长度;利用jieba分词实现作文中好词的自动抽取。Jiebe分词可在完成对文本进行分词的同时为每一个词打上标记,例如成语词、叠词等好词都可以自动标记出来。对于作文段落数的自动抽取,由于文本的分段符为“\n”,因此,利用Python中的split()函数将文本以“\n”为分隔符转换为数组,再利用Python中的len()函数获取数组长度,即可得到作文的段落数。(2)修辞评分特征提取。在小学作文中,排比句、比喻句、拟人句和引用句是四种较为常见的修辞手法。四种修辞手法与作文得分的Pearson相关性关系如下表所示。修辞评分特征Pearson相关系数排比句0.352比喻句0.442拟人句0.358引用句0.258可得到,四种修辞手法与作文得分之间呈现正相关关系,说明可以作为评分特征。(3)构建作文自动评分器。结合三个基础评分特征及四种修辞手法,构建作文自动评分器。鉴于评分器的效果会受作文类别不同的影响,故将作文类别加入到评分器的选择因素之中。将数据集中的文章分为写人、写景、写物和写景四类,为每一类作文进行各个分类器的交叉验证,选取最佳的机器学习分类器,验证结果如下表所示。可知,在对四类作文训练自动评分器时,GBDT分类器的性能均为最优值,因此,选择GBDT分类器作为最终的作文自动评分器。实验结果及说明利用上述方法,按照图1所示流程图,本专利技术提出了一种基于修辞使用的小学语文作文自动评价的方法。利用提取到的小学5年级和6年级待评分的作文743篇,包括写景类158篇、写事类238篇、写人类161篇、写物类186篇。教师的评分为ABCD四个等级,以30分为满分,A等级对于27-30分作文,B等级对于23-26分作文,C等级对应19-22分作文,D等级对应18分以下作文。测试指标为精确率、召回率及F1-score值,加入基础评分特征和修辞特征后的实验结果如下表所示。结果表明,加入了基础评分特征和修辞特征后,各类文章的自动评分准确率较只有基础评分特征的实验结果而言,F1-score值得到了较大的提升。(4)自动生成个性化评语。结合确定的七个评分特征,分别是:三个基础本文档来自技高网...

【技术保护点】
1.一种基于修辞使用的小学语文作文自动评价方法,其特征在于该方法包括以下步骤:(1)获取浅层次语义特征;浅层次语义特征包括作文中好词的使用、作文长度、段落数,利用Python脚本语言中的Sigmoid()函数获取作文长度,利用jieba分词获取好词,通过对浅层次语义特征的抽取,并将其与作文得分进行相关性分析,获取最终的基础评分特征;(2)基础评分特征的自动提取;将获取到的基础评分特征借助Python语言进行自动提取;利用Python语言中的Sigmoid()函数实现对作文长度的自动提取;利用jieba分词获取作文的好词;利用分隔符“\n”以及Python语言中的len()函数获取作文的段落数;(3)获取修辞类评分特征;选择在小学作文中常见的四类特征作为修辞类评分特征,分别是:排比句、比喻句、拟人句以及引用句;通过Pearson相关性分析,得到四类特征与作文得分的相关性关系,确定以此四类修辞特征作为修辞类评分特征的有效性;(4)构建作文自动评分器,结合基础评分特征及修辞类评分特征,构建作文自动评分器;(5)判断作文类型,考虑当前小学语文作文中的四类主要作文,辅助最优评分器的选择,四类作文为写景类、写物类、写人类和记事类;(6)确定最优的作文自动评价器;通过比较不同类型作文下,各个评分器的性能,得到适合于各个作文类别的分类器;利用该分类器,比较基础评分特征和加入了修辞特征后的自动评分结果,验证选择的作文自动评分器的有效性。...

【技术特征摘要】
1.一种基于修辞使用的小学语文作文自动评价方法,其特征在于该方法包括以下步骤:(1)获取浅层次语义特征;浅层次语义特征包括作文中好词的使用、作文长度、段落数,利用Python脚本语言中的Sigmoid()函数获取作文长度,利用jieba分词获取好词,通过对浅层次语义特征的抽取,并将其与作文得分进行相关性分析,获取最终的基础评分特征;(2)基础评分特征的自动提取;将获取到的基础评分特征借助Python语言进行自动提取;利用Python语言中的Sigmoid()函数实现对作文长度的自动提取;利用jieba分词获取作文的好词;利用分隔符“\n”以及Python语言中的len()函数获取作文的段落数;(3)获取修辞类评分特征;选择在小学作文中常见的四类特征作为修辞类评分特征,分别是:排比句、比喻句、拟人句以及引用句;通过Pearson相关性分析,得到四类特征与作文得分的相关性关系,确定以此四类修辞特征作为修辞类评分特征的有...

【专利技术属性】
技术研发人员:杨宗凯殷姿董鑫谯宇同龚颖石昀东刘三女牙朱晓亮
申请(专利权)人:华中师范大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1