一种基于深度语义分析的英语写作评价系统技术方案

技术编号:30528188 阅读:18 留言:0更新日期:2021-10-27 23:15
本发明专利技术属于自然语言处理技术领域,公开了一种基于深度语义分析的英语写作评价系统,包括:数据挖掘模块、写作主题获取模块、中央控制模块、作文预处理模块、主题相关性确定模块、重复率检测模块、错误检测模块、语义分析模块、综合评分模块以及输出模块。本发明专利技术能够从重复率、主题相关性、错误率、语义等多个层面进行英语作文的评价,不仅客观准确的输出评价分数,同时能够展示相应的作文中的错误,全面的分析作文中出现的问题,有利于后期进行针对性训练,查缺补漏,不仅有助于辅助促进学生对英语知识点的学习和拓展,还能间接地帮助学生提升他们的英语作文写作水平和习惯,设计合理,使用方便,效果良好。效果良好。效果良好。

【技术实现步骤摘要】
一种基于深度语义分析的英语写作评价系统


[0001]本专利技术属于自然语言处理
,尤其涉及一种基于深度语义分析的英语写作评价系统。

技术介绍

[0002]目前:对于自然语言处理技术的发展,无论国内国外的商业市场、科研领域,以及更大范围的人类社会对于大规模、大范围的真实文本内容的迅速、精确、深度分析的要求一直都极其迫切。全球科技界目前在处理大规模真实文本方面的技术手段主要分为(1)早期的自然语言处理技术(NLP)和(2)最近三十年逐渐形成的比之前技术先进了许多的的运用混合方法构建的深度语义分析模块化的处理技术。
[0003]现有的英语写作评价依然主要依靠人工来完成,不仅无法明确写作中存在的具体问题,且评价规则不明确,主观依赖性强。
[0004]通过上述分析,现有技术存在的问题及缺陷为:现有的英语写作评价依然主要依靠人工来完成,不仅无法明确写作中存在的具体问题,且评价规则不明确,主观依赖性强。

技术实现思路

[0005]针对现有技术存在的问题,本专利技术提供了一种基于深度语义分析的英语写作评价系统。
[0006]本专利技术是这样实现的,一种基于深度语义分析的英语写作评价系统,所述基于深度语义分析的英语写作评价系统包括:
[0007]数据挖掘模块,与中央控制模块连接,用于利用大数据挖掘技术采集各个英文写作数据库中的经典范文以及权威英文电子报上发布的英文文章;
[0008]所述数据挖掘模块利用大数据挖掘技术采集各个英文写作数据库中的经典范文以及权威英文电子报上发布的英文文章包括:确定本地对象与远程数据源同步频率,其中远程数据源即远程Web上数据库;利用泊松过程来表示远程数据源平均变化频率λ
i
,其中,i=1,2,

,n,n代表远程数据源的个数;
[0009]确定平均新颖度:由得到的平均变化频率λ
i
,确定各对象即远程Web上数据库中各数据项e
i
对应的同步频率f
i
,在满足同步资源限制的条件下,使本地数据库的平均新颖度最大,
[0010]根据数据时新性确定更新频率:
[0011]在时刻t数据抓取系统所维护的第i个数据记录r
i
的时新性如下:
[0012][0013]则由N个数据记录组成的数据记录集合S的平均时新性如下:
[0014][0015]所述数据记录集合S在时间上取平均值加以衡量:
[0016][0017]利用拉格朗日乘子计算得到各对象的理论同步频率,然后按理论同步频率对对象数据进行同步,使本地数据库的平均新颖度达到最大值;
[0018]所述按理论同步频率对对象数据进行同步,包括:
[0019]对于所有的(s,a)初始化表项Q0(s,a)=0;
[0020]其中,Q表示计算机机器学习领域的专业表示,即Q为增强学习的表示形式,s表示状态,a表示动作,Q(s,a)表示应用动作a到状态s的结果状态;初始化为0值,即未进行学习初始化值;在每个情节中,将对数据源的范围作为其活动,得到回报值为R
i

[0021][0022]并在时段0

t内,对Q值进行更新:
[0023][0024]其中q
j
表示第j个数据记录在时段0

t内进行增强学习得到的结果状态值,R
j
表示第j个数据记录在时段0

t内进行增强学习得到的回报值;
[0025]在资源限制的前提下,即与服务器最大交互次数M为固定值常量,使得新颖度值最大,F(f
i

i
)表示对应第i个数据记录的新颖度,新颖度是通过数据时新性得到,也就是时新性表示记录中对象即最小单位数据项的更新频率,而新颖度指数据项的集合记录也就是远程数据源的整体时新性,ω
i
是重要性权重;
[0026]主题相关性确定模块,与中央控制模块连接,用于基于对英语作文进行主题词提取并与本次待评价作文的预设主题进行对比,判断是否跑题;
[0027]重复率检测模块,与中央控制模块连接,用于将作文与数据库中存储的经典范文进行对比,判断与存储的经典范文的重复率;
[0028]错误检测模块,与中央控制模块连接,用于检测作文中是否存在词汇拼写错误、语法错误、语义错误以及篇章结果错误,并输出错误检测结果;
[0029]语义分析模块,与中央控制模块连接,用于基于英语作文预处理结果进行英语作文的语义分析;
[0030]综合评分模块,与中央控制模块连接,用于基于跑题判断结果、重复率检测结果、错误检测结果、语义分析结果进行英语写作的综合评价;
[0031]进一步,所述基于深度语义分析的英语写作评价系统还包括:
[0032]写作主题获取模块,与中央控制模块连接,用于采集并获取本次待评价作文的预设主题;
[0033]中央控制模块,与数据挖掘模块、写作主题获取模块、作文预处理模块、主题相关
性确定模块、重复率检测模块、错误检测模块、语义分析模块、综合评分模块以及输出模块连接,用于利用单片机或控制器控制各个模块正常工作;
[0034]作文预处理模块,与中央控制模块连接,用于对英语作文进行分段、分词、分句、词性标注和依存句法分析,并将分析结果汇总得到英语作文的预处理结果;
[0035]输出模块,与中央控制模块连接,用于将跑题判断结果、重复率检测结果、错误检测结果、语义分析结果以及评价结果进行输出。
[0036]进一步,所述主题相关性确定模块基于对英语作文进行主题词提取并与本次待评价作文的预设主题进行对比,判断是否跑题包括:
[0037]获取次待评价作文的预设主题,并对待评价英语作文的内容进行关键词提取;
[0038]对所述预设主题和所述英语作文内容关键词进行关键词分类,得到所述作文题目对应的第一实体关键词和第一修饰关键词,以及得到所述作文内容对应的第二实体关键词和第二修饰关键词;
[0039]基于预设英语词汇语义网Wordnet,分别计算各所述第二实体关键词与各所述第一实体关键词之间的第一相似度,并基于所述Wordnet分别计算各所述第二修饰关键词与各所述第一修饰关键词之间的第二相似度;
[0040]根据所述第一相似度和所述第二相似度,确定所述待评价英语作文内容与所述待评价作文的预设主题之间的相关性。
[0041]进一步,所述基于预设英语词汇语义网Wordnet,分别计算各所述第二实体关键词与各所述第一实体关键词之间的第一相似度包括:
[0042]分别将所述第一实体关键词和所述第二实体关键词映射至预设英语词汇语义网Wordnet中,以根据所述Wordnet确定各所述第一实体关键词对应的第一上位实体词和各所述第二实体关键词对应的第二上位实体词;
[0043]分别计算各所述第二上位实体词与各所述第一上位实体词之间的距本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度语义分析的英语写作评价系统,其特征在于,所述基于深度语义分析的英语写作评价系统包括:数据挖掘模块,与中央控制模块连接,用于利用大数据挖掘技术采集各个英文写作数据库中的经典范文以及权威英文电子报上发布的英文文章;所述数据挖掘模块利用大数据挖掘技术采集各个英文写作数据库中的经典范文以及权威英文电子报上发布的英文文章包括:确定本地对象与远程数据源同步频率,其中远程数据源即远程Web上数据库;利用泊松过程来表示远程数据源平均变化频率λ
i
,其中,i=1,2,

,n,n代表远程数据源的个数;确定平均新颖度:由得到的平均变化频率λ
i
,确定各对象即远程Web上数据库中各数据项e
i
对应的同步频率f
i
,在满足同步资源限制的条件下,使本地数据库的平均新颖度最大,根据数据时新性确定更新频率:在时刻t数据抓取系统所维护的第i个数据记录r
i
的时新性如下:则由N个数据记录组成的数据记录集合S的平均时新性如下:所述数据记录集合S在时间上取平均值加以衡量:利用拉格朗日乘子计算得到各对象的理论同步频率,然后按理论同步频率对对象数据进行同步,使本地数据库的平均新颖度达到最大值;所述按理论同步频率对对象数据进行同步,包括:对于所有的(s,a)初始化表项Q0(s,a)=0;其中,Q表示计算机机器学习领域的专业表示,即Q为增强学习的表示形式,s表示状态,a表示动作,Q(s,a)表示应用动作a到状态s的结果状态;初始化为0值,即未进行学习初始化值;在每个情节中,将对数据源的范围作为其活动,得到回报值为R
i
:并在时段0

t内,对Q值进行更新:其中q
j
表示第j个数据记录在时段0

t内进行增强学习得到的结果状态值,R
j
表示第j个数据记录在时段0

t内进行增强学习得到的回报值;
在资源限制的前提下,即与服务器最大交互次数M为固定值常量,使得新颖度值最大,F(f
i

i
)表示对应第i个数据记录的新颖度,新颖度是通过数据时新性得到,也就是时新性表示记录中对象即最小单位数据项的更新频率,而新颖度指数据项的集合记录也就是远程数据源的整体时新性,ω
i
是重要性权重;主题相关性确定模块,与中央控制模块连接,用于基于对英语作文进行主题词提取并与本次待评价作文的预设主题进行对比,判断是否跑题;重复率检测模块,与中央控制模块连接,用于将作文与数据库中存储的经典范文进行对比,判断与存储的经典范文的重复率;错误检测模块,与中央控制模块连接,用于检测作文中是否存在词汇拼写错误、语法错误、语义错误以及篇章结果错误,并输出错误检测结果;语义分析模块,与中央控制模块连接,用于基于英语作文预处理结果进行英语作文的语义分析;综合评分模块,与中央控制模块连接,用于基于跑题判断结果、重复率检测结果、错误检测结果、语义分析结果进行英语写作的综合评价。2.如权利要求1所述基于深度语义分析的英语写作评价系统,其特征在于,所述基于深度语义分析的英语写作评价系统还包括:写作主题获取模块,与中央控制模块连接,用于采集并获取本次待评价作文的预设主题;中央控制模块,与数据挖掘模块、写作主题获取模块、作文预处理模块、主题相关性确定模块、重复率检测模块、错误检测模块、语义分析模块、综合评分模块以及输出模块连接,用于利用单片机或控制器控制各个模块正常工作;作文预处...

【专利技术属性】
技术研发人员:董迪雯王晓峰
申请(专利权)人:湖南环境生物职业技术学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1