The invention provides an automatic detection and analysis method for grammatical errors in English compositions. In this method, the input sentences of the English compositions to be checked are first broken, then the words in each sentence are segmented, and then the words are spelled checked. After spelling checking, all the words are part-of-speech labeled, and then the labeled words with multiple labels are corrected. Then, the flow chart of different error instance rules is constructed, and the grammar of sentences is checked by combining the existing grammar rules and error examples. Finally, the position of grammar errors in the composition is located, and the specific amendments are given. The invention can locate grammatical errors, give specific error contents and solutions, and expand grammatical rules by modifying the flow chart of error examples. The invention has the high ability of detecting and correcting grammatical errors in an English composition, can quickly detect and feedback grammatical errors in an English composition, and can be applied to a real-time environment.
【技术实现步骤摘要】
英语作文语法错误自动检测与分析方法
本专利技术一般涉及自然语言处理研究领域,具体涉及英语作文语法错误自动检测与分析方法。
技术介绍
现如今是高度全球化的世界,在这个背景下,英语成为了与世界沟通必不可少的桥梁。英语作为全球应用最为普及的一门语言,以英语为母语有4亿人左右,将英语作为第二语言进行沟通的人却超过了10亿。非英语母语的英语学习者所书写的英文文本占比高达70%,他们在进行英文写作的过程中,在语法上难免会犯错。尤其是在学术交流上,英语论文作为展示个人学术水平的重要工具,在学术交流过程中具有重要的作用。而英语作文语法的自动检测方法,则能够在一定程度上帮助各种英语学习人员检查自己的写作语法错误,避免一些低级错误的发生。现有的自然语法处理领域的研究主要有两大类,一类是语言学和教育学上的理论研究,一类是应用软件专利技术的软件系统研发。前者的研究为后者带来理论上的支持,后置为前者提供技术上的支持,但是目前国内在软件应用方面更多停留在理论研究上。国外目前存在一些比较成熟的方法,不同方法的优缺点各有不同,ProjectEssayGrader(PEG)是世界上最早出现的英语作文智能批改系统,不过该系统的运行效率很低,只能勉强完成评分工作;AES(AutomaticEssayScoring)系统同样可用对英语作文进行自动批阅和评分,对语法错误进行评判,但是AES系统还很难解决语义错误、结构错误以及语用错误。目前国内的AES系统,有语法检测,作文评分,主题关联检测等各种繁复的功能,但其核心的语法纠错部分准确率却非常低,不能根据不同的需要自定义变更检测规则,系统可扩展性也不 ...
【技术保护点】
1.英语作文语法错误自动检测与分析方法,其特征在于,包括以下步骤:对前台获取提交的英语作文进行语句分句以及单词分词处理;对步骤(a)中分词得到的所有单词进行拼写检查,反馈单词拼写对错情况以及存在的固定短语搭配;若单词拼写无误,则对步骤(b)中拼写检查后所有单词,使用斯坦福分析器进行词性标记;步骤(c)中进行词性标记后的单词可能会有多个词性标记,计算出所有词性标记的概率,选择概率最高的词性标记;将常见的英文语法错误构建出词性标记的负实例规则流程图;将步骤(d)中每个带词性标记的单词,根据其词性标记与步骤(e)中负实例规则流程图进行对比处理;于前台返回英语作文的语法错误以及推荐的修改方案,并将数据同步存储到数据库。
【技术特征摘要】
1.英语作文语法错误自动检测与分析方法,其特征在于,包括以下步骤:对前台获取提交的英语作文进行语句分句以及单词分词处理;对步骤(a)中分词得到的所有单词进行拼写检查,反馈单词拼写对错情况以及存在的固定短语搭配;若单词拼写无误,则对步骤(b)中拼写检查后所有单词,使用斯坦福分析器进行词性标记;步骤(c)中进行词性标记后的单词可能会有多个词性标记,计算出所有词性标记的概率,选择概率最高的词性标记;将常见的英文语法错误构建出词性标记的负实例规则流程图;将步骤(d)中每个带词性标记的单词,根据其词性标记与步骤(e)中负实例规则流程图进行对比处理;于前台返回英语作文的语法错误以及推荐的修改方案,并将数据同步存储到数据库。2.根据权利要求1所述英语作文语法错误自动检测与分析方法,其特征在于:步骤(a)中,语句分句规则,对一篇英语作文中所有句点,包括“圆点、感叹号、问号”做如下标记:[左单词][前缀][句点][后缀][右单词],其中前缀是指与句点前相连的字符串,后缀是句点其后相连的字符串,右单词是指句点其后紧接的下一个单词;然后依据流程(1)-(5)对每一个句点进行判断是否是句尾,从而实现分句:(1)前缀的最后一个字符为“.”时,判断为句尾;(2)后缀为空,且右单词为空,则可以判断为段末,亦为句尾;(3)后缀为空格,右单词不为空,且右单词首字母大写,若前缀不为Mr、Mrs、Ms、Dr、Miss的缩略语则为句尾;为此将会建立一个由常用缩略语组成的停词表;(4)后缀不为空格,且后缀首字母大写,若前缀后缀均不含其他句点,则为句尾;(5)其他情况可以判断为不属于句尾。3.根据权利要求1所述英语作文语法错误自动检测与分析方法,其特征在于:步骤(b)中,采用多级索引表的方式构建英语单词数据库,以单词开头的前三个字母作为词库的索引表。4.根据权利要求1所述英语作文语法错误自动检测与分析方法,其...
【专利技术属性】
技术研发人员:黄翰,刘方青,卢尔昂,郝志峰,许悦婷,
申请(专利权)人:华南理工大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。