一种基于卷积神经网络的英语作文评分方法技术

技术编号:31716597 阅读:21 留言:0更新日期:2022-01-01 11:23
本发明专利技术公开了一种基于卷积神经网络的英语作文评分方法,包括如下步骤:步骤一、对待评分的英语作文进行预处理获得待处理数据;步骤二、对所述待处理数据进行特征提取;步骤三、将所述特征分别输入卷积神经网络模型中,获得特征的比重矩阵,将所述特征的比重矩阵合并获得所述英语作文的评分。本发明专利技术对英语作文进行特征提取,并通过特征结合卷积神经网络模型,实现了对英语作文的客观评分,保证了评分的准确性和一致性,消除了人为主观因素影响;并能够使学生针对薄弱部分进行特定的学习和强化。使学生针对薄弱部分进行特定的学习和强化。使学生针对薄弱部分进行特定的学习和强化。

【技术实现步骤摘要】
一种基于卷积神经网络的英语作文评分方法


[0001]本专利技术涉及英语
,更具体的是,本专利技术涉及一种基于卷积神经 网络的英语作文评分方法。

技术介绍

[0002]英语作文是大规模英语考试中的一种必备题型,在学生英语水平考核中 占有相当大的比重,无论是在我国的高考、研究生考试还是在国外的TOEFL、 GRE、IELTS中,英语作文都是检测英语学习者语言综合运用能力考核的一 项重要指标。
[0003]但是,目前在我国,随着教育的发展,英语学习者的人数越来越多,作 文批阅数量激增,而由于教师数量却相当有限,教师在作文批阅方面显得有 些力不从心,并且,在我国大规模的英语考试当中,由于考生数量众多,需 要多名评分人员对考生的作文进行评分,而不同评分人员受个人喜好、习惯、 评阅时的心理状态等因素的影响,导致学生成绩存在一定的误差。
[0004]面对上述问题,如果能够开发一种实用的英语作文自动评分系统,实现 客观、公平而且能够及时反馈作文写作信息的作文自动评分技术的同时,可 以大大减轻教师的工作量,使教师有更多的心力倾注到其他教学任务上去。 因此,研究开发一款针对国内英语学习者的英语作文自动评分系统具有重大 的现实意义。
[0005][0006]
技术实现思路

[0007]本专利技术的目的是设计开发了一种基于卷积神经网络的英语作文评分方法, 利用英语作文的特征,结合卷积神经网络模型,实现了对英语作文的客观评 分,保证了评分的准确性和一致性。
[0008]本专利技术提供的技术方案为:<br/>[0009]一种基于卷积神经网络的英语作文评分方法,包括如下步骤:
[0010]步骤一、对待评分的英语作文进行预处理获得待处理数据;
[0011]步骤二、对所述待处理数据进行特征提取;
[0012]步骤三、将所述特征分别输入卷积神经网络模型中,获得特征的比重矩 阵,将所述特征的比重矩阵合并获得所述英语作文的评分:
[0013][0014]式中,g
N
为英语作文的评分,ω
i
为各个特征的评分比重,p
i
为各个特征 的评分。
[0015]优选的是,所述预处理包括对所述待评分的英语作文进行分段处理、分 句处理、分词处理和词性标注。
[0016]优选的是,所述特征包括:词法特征、句法特征和结构性特征。
[0017]优选的是,所述词法特征包括:形符数、类符数、形符比、平均词长、 长度大于N的单词、拼写错误、形容词个数、基数词个数、限定词个数、 介词个数、形容词个数、情态动词个数、物质名词和语法错误;
[0018]所述句法特征包括:简单陈述句个数、形容词短语个数、副词短语个数、 连词短语个数、片段数、名词短语数、介词短语数、句子数和平均句长;
[0019]所述结构性特征包括:符号类型数、文中符号数、作文字符长度、逗号 频数、句号频数、篇章连词数、段落数、平均每段包括的句数、第一段的句 子占整个作文的比例、最后一段的句子占整个作文的比例。
[0020]优选的是,所述卷积神经网络模型包括一个卷积层、一个池化层、一个 全连接层和一个输出层,所述卷积神经网络模型的构建过程包括如下步骤:
[0021]步骤1、在卷积层中,以所述特征分别作为所述卷积层的输入数据进行 卷积操作,所述卷积层的输出矩阵满足:
[0022][0023]式中,f为卷积层的激活函数,W
l,m
为卷积核,且卷积核的大小为l
×
m, a
i+m
为卷积层的特征输入数据,b为共享偏置;
[0024]步骤2、在所述池化层中,提取所述卷积层的输出矩阵的最大值,并进 行抹零处理,获得池化层的输出矩阵;
[0025]步骤3、在所述全连接层中,将所述池化层的输出矩阵转换为1
×
n的矩阵 形式后进行归一化处理,获得全连接层的输出矩阵;
[0026]步骤4、在所述输出层中,将所述全连接层的输出矩阵通过输出层输出 多个特征的比重矩阵,同时调整模型内部参数,优化预测精度,直至模型内 部参数收敛,得到训练完成的卷积神经网络模型。
[0027]优选的是,所述各个特征的评分满足:
[0028][0029]式中,ξ
i
为修正权值,且ξ
i
的取值范围为[5.5

22],X
i
为文本特征向量,U
i
为全连接层的输出矩阵,V
i
为特征的比重矩阵。
[0030]优选的是,所述词法特征的评分比重为25%,所述句法特征的评分比重 为15%,所述结构性特征60%。
[0031]优选的是,所述步骤4具体包括:
[0032]在所述输出层中,将所述全连接层的输出矩阵通过输出层输出多个特征 的比重矩阵,计算出各个特征的评分,将所述特征的比重矩阵合并获得所述 英语作文的预测评分,将所述预测评分与人工评分进行误差计算,对卷积神 经网络进行更新至损失函数收敛,获得卷积神经网络模型。
[0033]优选的是,所述抹零处理为ReLU函数。
[0034]优选的是,所述归一化处理的归一域为[

1,1]。
[0035]本专利技术所述的有益效果:
[0036]本专利技术设计开发的一种基于卷积神经网络的英语作文评分方法,通过对 英语作
文进行特征提取,并使特征与卷积神经网络模型相结合,实现了对英 语作文的客观评分,保证了评分的准确性和一致性,消除了人为主观因素影 响;并能够凸显出各个英语作文中的薄弱部分,使学生针对薄弱部分进行特 定的学习和强化,进一步提高英语成绩。
附图说明
[0037]图1为本专利技术所述基于卷积神经网络的英语作文评分方法的流程示意图。
具体实施方式
[0038]下面结合对本专利技术做进一步的详细说明,以令本领域技术人员参照说明 书文字能够据以实施。
[0039]如图1所示,本专利技术提供的一种基于卷积神经网络的英语作文评分方法, 包括如下步骤:
[0040]步骤一、对待评分的英语作文进行预处理获得待处理数据:
[0041]所述预处理包括对所述待评分的英语作文进行分段处理、分句处理、分 词处理,得到作文的段落、句子、标点以及单词,以便于通过得到的段落、 句子、标点、单词等对词法特征以及结构特征进行统计分析;
[0042]同时,采用自然语言处理技术对文章进行词性标注,以便于对句法特征 的统计分析以及对单词错误和语法错误的检查。
[0043]步骤二、对所述待处理数据进行特征提取:
[0044]所述特征包括:词法特征、句法特征和结构性特征;
[0045]所述词法特征包括:形符数、类符数、形符比、平均词长、长度大于N 的单词、拼写错误、形容词个数、基数词个数、限定词个数、介词个数、形 容词个数、情态动词个数、物质名词和语法错误,单词的数量反映了作文本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于卷积神经网络的英语作文评分方法,其特征在于,包括如下步骤:步骤一、对待评分的英语作文进行预处理获得待处理数据;步骤二、对所述待处理数据进行特征提取;步骤三、将所述特征分别输入卷积神经网络模型中,获得特征的比重矩阵,将所述特征的比重矩阵合并获得所述英语作文的评分:式中,g
N
为英语作文的评分,ω
i
为各个特征的评分比重,p
i
为各个特征的评分。2.如权利要求1所述的基于卷积神经网络的英语作文评分方法,其特征在于,所述预处理包括对所述待评分的英语作文进行分段处理、分句处理、分词处理和词性标注。3.如权利要求2所述的基于卷积神经网络的英语作文评分方法,其特征在于,所述特征包括:词法特征、句法特征和结构性特征。4.如权利要求3所述的基于卷积神经网络的英语作文评分方法,其特征在于,所述词法特征包括:形符数、类符数、形符比、平均词长、长度大于N的单词、拼写错误、形容词个数、基数词个数、限定词个数、介词个数、形容词个数、情态动词个数、物质名词和语法错误;所述句法特征包括:简单陈述句个数、形容词短语个数、副词短语个数、连词短语个数、片段数、名词短语数、介词短语数、句子数和平均句长;所述结构性特征包括:符号类型数、文中符号数、作文字符长度、逗号频数、句号频数、篇章连词数、段落数、平均每段包括的句数、第一段的句子占整个作文的比例、最后一段的句子占整个作文的比例。5.如权利要求4所述的基于卷积神经网络的英语作文评分方法,其特征在于,所述卷积神经网络模型包括一个卷积层、一个池化层、一个全连接层和一个输出层,所述卷积神经网络模型的构建过程包括如下步骤:步骤1、在卷积层中,以所述特征分别作为所述卷积层的输入数据进行卷积操作,所述卷积层的输出矩阵满足:式中,f为卷积层的激活函数,W
l,m
为卷积核,且卷积核的大小为l
×...

【专利技术属性】
技术研发人员:刘曲杨天地马丽娣
申请(专利权)人:锦州医科大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1