基于双向长短期记忆递归神经网络的英语作文多维度评分方法及系统技术方案

技术编号:38755509 阅读:13 留言:0更新日期:2023-09-10 09:40
本发明专利技术公开了一种基于双向长短期记忆递归神经网络的英语作文多维度评分方法及系统,涉及教学作业批改技术领域。评分方法为:获取作文并自动检测作文中的标点符号,根据预设的标点符号将作文拆分为语句;从所选的语句中提取浅层人工特征,并对浅层人工特征进行评分;根据预设的话题决策模块,将语句聚合为一个个话题,进行切题度评分;根据预设的语义模型,对作文整体进行语义评分;获取所述的浅层特征分值、切题度分值、语义分值,并进行综合评分,得到最终评分。评分系统包括作文获取模块、语句拆分模块、综合分值计算模块与评分输出模块等多个模块。本发明专利技术解决了现有技术中对标注数据依赖性强、受数据规模的约束等多种问题,满足课堂学习及考试评分的要求。课堂学习及考试评分的要求。课堂学习及考试评分的要求。

【技术实现步骤摘要】
基于双向长短期记忆递归神经网络的英语作文多维度评分方法及系统


[0001]本专利技术涉及教学作业批改
,具体为一种基于双向长短期记忆递归神经网络的英语作文多维度评分方法及系统。

技术介绍

[0002]英语写作作为英语学习过程中的重要环节,以及各类英语考试的重要组成部分,对学生的英语阅读、写作能力要求都比较高,是学生英语能力的综合体现。在传统英语作文批阅中,英语老师对作文的评分存在主观性强,耗时长等问题。
[0003]英语作文自动评分系统以其客观、公正和处理迅速的特点在一定程度上解决了上述问题。目前主流的英语作文自动评分方法分为以下两种:基于人工特征的作文评分方法和基于深度学习的作文评分方法。
[0004]基于人工特征的作文评分方法针对不同的作文要求,实施方案中需要改变人工特征参数来适用不同的场景,但一些深层语义特征需要在理解文章的基础上进行提取,这些深层语义特征很难被特征模型捕获。
[0005]基于深度学习的作文评分方法,在一定程度上解决了深层语义特征信息抽取难,但深度学习模型本质上是监督学习问题,存在对标注数据依赖性强、受数据规模的约束、模型的泛化性不足、无法识别单词错误、无法识别单词数量等作文浅层特征问题。
[0006]综上所述,现有方案均无法满足现有英语作文自动评分要求。因此,有必要设计一种适用于英语考试且能从多角度对作文进行评分的英语作文的评分方法及系统。

技术实现思路

[0007]本专利技术为了解决现有英语作文自动评分系统仅从单一维度给予作文一个客观公正的分数的问题,提供了一种基于双向长短期记忆递归神经网络的英语作文多维度评分方法及系统,适用于大型英语考试且能从多角度对作文进行评分。
[0008]本专利技术是通过如下技术方案来实现的:一种基于双向长短期记忆递归神经网络的英语作文多维度评分方法,包括如下步骤:(1)获取作文并自动检测作文中的标点符号,根据预设的标点符号将作文拆分为语句;(2)从所选的语句中提取浅层人工特征,并对浅层人工特征进行评分;(3)根据预设的话题决策模块,将语句聚合为一个个话题,进行切题度评分;(4)根据预设的语义模型,对作文整体进行语义评分;(5)获取所述的浅层特征分值、切题度分值、语义分值,并进行综合评分,得到最终评分。
[0009]进一步的,步骤(2)中,从所选的语句中提取浅层人工特征,包括从写作者的词汇量掌握程度和句子组织水平等多个角度对语句进行浅层人工特征抽取,提取的浅层人工特
征包括但不限于单词拼写错误、介词使用、连接词使用和高级词汇使用情况、句子语法错误、句子可读性;对浅层人工特征进行评分,包括对提取到的浅层特征进行评分,获得各个语句的浅层特征分值后进行加权平均计算,获得作文的浅层特征分值。
[0010]进一步的,步骤(3)中,所述预设的话题决策模块,是以对拆分后的语句以单词为粒度进行Bert编码后的向量表示为输入,以双向长短期记忆网络BiLSTM为架构生成的话题分割模型,用于将拆分所得的语句聚合成一个个话题;所述切题度评分,包括对作文主题与各个话题分别以BERT

Sentence模型进行语义向量化,并计算作文主题与各个话题之间的语义相似度,获得各个话题的切题度分数并进行加权平均计算,获得作文的切题度分值。
[0011]进一步的,步骤(4)中,所述预设的语义模型,是以对作文以句子为粒度进行Bert编码后的向量表示为输入,以BiLSTM为架构生成的语义模型,用于对作文整体进行语义评分,获得语义分值。
[0012]进一步的,步骤(5)中,对(2)、(3)、(4)中分别得到的浅层特征分值、切题度分值、语义分值进行综合评分,得到作文的最终得分。
[0013]基于上述一种基于双向长短期记忆递归神经网络的英语作文多维度评分方法,本专利技术还提供了一种基于双向长短期记忆递归神经网络的英语作文多维度评分系统,包括作文获取模块,所述作文获取模块输出作文信息至语句拆分模块,所述语句拆分模块输出信息至浅层人工特征提取模块、词向量构造模块与句向量构造模块,所述浅层人工特征提取模块输出信息至浅层特征分值计算模块,所述词向量构造模块输出信息至话题决策模块,所述话题决策模块输出信息至切题度分值计算模块;所述句向量构造模块输出信息至语义分值计算模块,所述浅层特征分值计算模块、切题度分值计算模块与语义分值计算模块将相应信息全部输出至综合分值计算模块,所述综合分值计算模块将评分通过评分输出模块发出。
[0014]进一步的,所述作文获取模块用于自动识别英语作文、获取作文数据;所述语句拆分模块用于根据预设的标点符号拆分所述作文,将作文拆分为语句;所述浅层人工特征提取模块,用于从所选的语句中提取浅层人工特征,包括从写作者的词汇量掌握程度和句子组织水平的角度对所述语句进行浅层人工特征抽取,提取的浅层特征包括但不限于单词拼写错误、介词使用、连接词使用和高级词汇使用情况、句子语法错误、句子可读性;所述浅层特征分值计算模块,用于对提取到的浅层特征进行评分,获得各个语句的浅层特征分值后进行加权平均计算,获得作文的浅层特征分值;所述词向量构造模块,用于将语句以单词为粒度进行Bert编码,形成词向量表示;所述话题决策模块,用于通过所述词向量,将所述语句聚合为一个个话题;所述切题度分值计算模块,用于对作文主题与各个话题分别以BERT

Sentence模型进行语义向量化,并计算作文主题与各个话题之间的语义相似度,获得各个话题的切题度分数并进行加权平均计算,获得作文的切题度分值;所述句向量构造模块,用于将作文以句子为粒度进行Bert编码,形成句向量表示;所述语义分值计算模块,用于通过句向量对作文整体进行语义评分,获得语义分值;所述综合分值计算模块,用于对浅层特征分值、切题度分值、语义分值进行综合评分,获得作文的最终得分;所述评分输出模块,用于对作文的最终得分进行输出。
[0015]与现有技术相比本专利技术具有以下有益效果:本专利技术所提供的一种基于双向长短期记忆递归神经网络的英语作文多维度评分方法及系统:
(1)本专利技术利用组合方法从浅层特征、切题度、作文整体语义角度对作文进行多维度评分,加强了模型的泛化性,评分相较于已有方案更加客观、公正、准确,适用于不同的场景。
[0016]本专利技术利用预训练模型的在语义表示上的优势,缓解了基于深度学习的作文评分方法存在的对标注数据依赖性强、受数据规模的约束、模型的泛化性不足的问题。
[0017]本专利技术解决了人工评分存在的主观性强,耗时长等问题,适用于各种英语考试。
[0018]综上所述,本专利技术设计合理,能有效增加作文评分的客观性、公正性和准确性,解决了基于深度学习的作文评分方法存在的对标注数据依赖性强、受数据规模的约束、模型的泛化性不足、不能提取作文浅层特征的问题,能很好的满足课堂学习以及考试评分的要求。
附图说明
[0019]图1为本专利技术一种基于双向长短期记忆递归神经网络的英语作文多维度评分方法的流程示意图。
[0020]图2为本专利技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于双向长短期记忆递归神经网络的英语作文多维度评分方法,其特征在于:包括如下步骤:(1)获取作文并自动检测作文中的标点符号,根据预设的标点符号将作文拆分为语句;(2)从所选的语句中提取浅层人工特征,并对浅层人工特征进行评分;(3)根据预设的话题决策模块,将语句聚合为一个个话题,进行切题度评分;(4)根据预设的语义模型,对作文整体进行语义评分;(5)获取所述的浅层特征分值、切题度分值、语义分值,并进行综合评分,得到最终评分。2.根据权利要求1所述的一种基于双向长短期记忆递归神经网络的英语作文多维度评分方法,其特征在于:步骤(2)中,从所选的语句中提取浅层人工特征,包括从写作者的词汇量掌握程度和句子组织水平的角度对语句进行浅层人工特征抽取,提取的浅层人工特征包括单词拼写错误、介词使用、连接词使用和高级词汇使用情况、句子语法错误、句子可读性;对浅层人工特征进行评分,包括对提取到的浅层特征进行评分,获得各个语句的浅层特征分值后进行加权平均计算,获得作文的浅层特征分值。3.根据权利要求2所述的一种基于双向长短期记忆递归神经网络的英语作文多维度评分方法,其特征在于:步骤(3)中,所述预设的话题决策模块,是以对拆分后的语句以单词为粒度进行Bert编码后的向量表示为输入,以双向长短期记忆网络BiLSTM为架构生成的话题分割模型,用于将拆分所得的语句聚合成一个个话题;所述切题度评分,包括对作文主题与各个话题分别以BERT

Sentence模型进行语义向量化,并计算作文主题与各个话题之间的语义相似度,获得各个话题的切题度分数并进行加权平均计算,获得作文的切题度分值。4.根据权利要求3所述的一种基于双向长短期记忆递归神经网络的英语作文多维度评分方法,其特征在于:步骤(4)中,所述预设的语义模型,是以对作文以句子为粒度进行Bert编码后的向量表示为输入,以BiLSTM为架构生成的语义模型,用于对作文整体进行语义评分,获得语义分值。5.根据权利要求4所述的一种基于双向长短期记忆递归神经网络的英语作文多维度评分方法,其特征在于:步骤(5)中,对(2)、(3)、(4)中分别得到的浅层特征分值、切题度分值、语义分值进行综合评分,得到作文的最终...

【专利技术属性】
技术研发人员:李壮爱史鹏飞雷一航王大铭康珉
申请(专利权)人:山西传媒学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1