不依赖人工预评分的大学英语作文自动评分系统及方法技术方案

技术编号:8106148 阅读:453 留言:0更新日期:2012-12-21 05:18
本发明专利技术公开了不依赖人工预评分的大学英语作文自动评分系统及评分方法,该系统由训练作文特征词-作文矩阵生成模块、训练作文语义空间构建模块、待评分作文自动评分模块构成,训练作文特征词-作文矩阵生成模块中“构建特征词-作文矩阵”处理单元的处理结果“特征词-作文矩阵”,输入到训练作文语义空间构建模块中“构建训练作文集语义空间”处理单元,训练作文语义空间构建模块中“映射满分作文集特征词词频向量到训练作文集语义空间”处理单元的处理结果“满分作文集语义空间”,输入到待评分作文自动评分模块中“计算待评分作文分数”处理单元。本系统可以大大减轻大学英语教师批阅学生英语作文的工作量,而且评分的信度和效度高。

【技术实现步骤摘要】

本专利技术涉及中国高校大学英语作文的自动评分技术与方法,具体是一种不依赖人工预评分的大学英语作文自动评分系统及评分方法。
技术介绍
英语作文自动评分技术的研究起源于1966年美国杜克大学的Ellis Page等人研发的PEG系统。现有的英语作文自动评分系统可以分为三类侧重语言特征的英语作文自动评分系统,如PEG系统;侧重内容不同的英语作文自动评分系统,如IEA系统、BETSY系统;两者兼顾的英语作文自动评分系统,如e-rater系统、IntelliMetric系统、梁茂成系统等。其中PEG系统以作文中可量化参数作为自变量,以作文的最后得分作为因变量,通过评估作文中可量化参数来计算待评分作文的最后得分。IEA系统通过预评分作文样本的分数参数来评分作文,通过综合考虑待评分作文的内容质量指标与写作技巧指标来对待评分作 文进行评分。IntelliMetric系统通过训练预评分作文样本构建评分模型,对利用少量待评分作文检测评分模型的信度与效度,最后利用得到的评分模型对大量待评分作文进行评分。e-rater系统首先对待评分作文中单词进行词性标注,分析待评分作文中句法结构、篇章结构和词汇使用情况本文档来自技高网...

【技术保护点】
一种不依赖人工预评分的大学英语作文自动评分系统,其特征是:该系统由训练作文特征词?作文矩阵生成模块、训练作文语义空间构建模块、待评分作文自动评分模块构成,训练作文特征词?作文矩阵生成模块中“构建特征词?作文矩阵”处理单元的处理结果“特征词?作文矩阵”,输入到训练作文语义空间构建模块中“构建训练作文集语义空间”处理单元,训练作文语义空间构建模块中“映射满分作文集特征词词频向量到训练作文集语义空间”处理单元的处理结果“满分作文集语义空间”,输入到待评分作文自动评分模块中“计算待评分作文分数”处理单元,系统输出待评分英语作文的分数。

【技术特征摘要】
1.一种不依赖人工预评分的大学英语作文自动评分系统,其特征是该系统由训练作文特征词-作文矩阵生成模块、训练作文语义空间构建模块、待评分作文自动评分模块构成,训练作文特征词-作文矩阵生成模块中“构建特征词-作文矩阵”处理单元的处理结果“特征词-作文矩阵”,输入到训练作文语义空间构建模块中“构建训练作文集语义空间”处理单元,训练作文语义空间构建模块中“映射满分作文集特征词词频向量到训练作文集语义空间”处理单元的处理结果“满分作文集语义空间”,输入到待评分作文自动评分模块中“计算待评分作文分数”处理单元,系统输出待评分英语作文的分数。2.根据权利要求I所述的不依赖人工预评分的大学英语作文自动评分系统,其特征是所述的训练作文特征词-作文矩阵生成模块包括处理训练作文集单元,其工作流程是 (5201)开始; (5202)读入停用词列表; (5203)读入训练作文集中作文; (5204)标注训练作文集中作文的单词词性并输出它们的标注单词列表; (5205)如果单词列表没有结束,则通过正则表达式从标注单词列表中提取一个单词;否则转(S208)操作; (5206)如果提取的单词是停用词,则从标注单词列表中删除该单词,并读取标注单词列表中下一个单词,然后转(S205)操作;否则统计训练作文集中出现该单词的作文数; (5207)如果该单词出现的作文数>2,则该单词是特征词并添加该单词到特征词列表中;否则转(S205)操作; (5208)从特征词列表中统计特征词词频,并根据所得到的特征词词频构建训练作文集的特征词-作文矩阵; (5209)生成训练作文集的特征词-作文矩阵; (5210)结束。3.根据权利要求I所述的不依赖人工预评分的大学英语作文自动评分系统,其特征是所述的训练作文语义空间构建模块包括构建训练作文集语义空间、处理满分作文集单元、映射满分作文集特征词词频向量到训练作文集语义空间单元,其工作流程是 (5301)开始; (5302)读入满分作文集中作文; (5303)标注满分作文集中作文的单词词性并输出它们的标注单词列表; (5304)如果标注单词列表没有结束,则通过正则表达式从标注单词列表中提取一个单词;否则转(S306)操作; (5305)如果提取的单词是特征词,则统计它的词频;否则从标注单词列表中删除该单词,并读取标注单词列表下一个单词,然后转(S304)操作; (5306)构建满分作文集的特征词词频向量; (5307)处理训练作文集的特征词-作文矩阵,并构建训练作文集的语义空间; (5308)映射满分作文集的特征词词频向量到训练作文...

【专利技术属性】
技术研发人员:黄桂敏周娅曹国媛
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1