一种对英文文本进行纠错及句法分析的逻辑方法技术

技术编号:25915801 阅读:19 留言:0更新日期:2020-10-13 10:34
本发明专利技术提出一种英文文本纠错和句法分析的方法,用于处理英文文本,对错误句子进行纠错,给出错误提示信息,对于正确句子,能够进行句子的语法现象解析,给出句子基本句型,句子组成结构,短语依赖关系以及修饰词、固定搭配等信息。基于本发明专利技术,可以帮助英语初学者更有效的提高写作能力,对于错误进行针对性纠错,并学习优秀句子的句子结构。

【技术实现步骤摘要】
一种对英文文本进行纠错及句法分析的逻辑方法
本专利技术属于自然语言处理
,具体涉及两个研究方面,一方面是英语文本错误的自动检测技术,另一方面是英语文本句法的语法分析。其主要运用于英语写作的辅导,同时,这两个技术也可以单独独立使用。
技术介绍
英语作为全球应用最为普及的一门语言,是全球化环境下交流的必备技能,而英文文本作为交流沟通的一大媒介,尤其在学术论文、商务书面交流上,占据主导地位。因此,英文写作能力的提高成为越来越多人的需求,而阅读优秀的相关论题的英文文本是大部分人在提高自己写作能力时所选择的策略,但网上信息的质量参差不齐,初学者并不能很好的进行甄选,英文文本纠错与句法分析方法,可以帮助英语初学者更有效的提高写作能力,对所选英文文本进行纠错和句法分析之后,错误的句子会返回错误信息提示,正确的句子则返还该句子的语法信息,以及具有的句法结构等信息,帮助学习者更好的理解写作方法。现有的相关技术更多地停留在解决英文文本的错误自动检测部分,没有涉及到正确句子的结构以及语法分析部分。关于英文文本自动纠错的研究,已经公开发表发布了多篇专利,以及多款应用程序,例如,CN108519974A专利中提供了一种英语作文语法错误自动检测与分析方法,将英语作文进行分句、分词、拼写检查,并用斯坦福分析器进行词性标注,然后词性标记修正,构建负实例规则流程图,返回结果;CN101814065B专利,提出了一种使用正则表达式描述句法分析规则的句法分析装置和句法分析方法;除此之外,国外公布的应用程序Grammarly、Ginger和WhiteSmoke,以及国内学生常用的批改网,都是进行英文文本的纠错。现有的纠错方法和软件中,仅仅关注英文文本错误语法的提醒,忽略了给予正确的优美句子的解析,帮助提高英语学习者的写作能力。另一方面,英文文本的纠错,基本的语法纠错等大部分能够实现,但是由于重视普适性,反而忽略了不同人群群体对于语言应用能力的不同,导致很多提示没有针对性,甚至,特定群体下的错误基本不能进行纠错。比如,小学生英文写作常见问题和科研学术论文的纠错重点明显应该是不同的,前者更加重视语法结构和词汇量的运用,而后者更加关注专业词汇的表达准确与否,以及表达的可理解性。
技术实现思路
鉴于上述情况,本专利技术提出一种英文文本纠错和句法分析的方法,用于处理英文文本,对错误句子进行纠错,给出错误提示信息,对于正确句子,能够进行句子的语法现象解析,给出句子基本句型,句子组成结构,短语依赖关系以及修饰词、固定搭配。英语写作场景的补充以及相应语法错误模式的识别纠错,可以根据用户的需求不断完善,用于任何的英语教育辅导程序本专利技术与现有技术的对比中,主要创新点在于:1.采用合适的逻辑结构,不仅考虑对于英语文本的纠错,同时可将句子的正确语法现象输出,最重要的一点就是,能够利用这些正确句子语法分析结果,辅助学习者对正确句子(包括优美句子)进行写法学习,学习例句的句子组成结构和用词搭配等,以此来提高写作水平;2.基于LangageTool工具包进行纠错的扩展,不仅支持常见的错误规则模式,而且结合应用场景和用户的不同,进行规则化的添加相应错误模式,进行不同场景下的用户模式封装。对英语文本进行纠错与句法分析的逻辑方法,具体技术路线如下:对输入的文本根据句子是否有错进行两个模块的逻辑划分,若句子有错,则进行文本纠错模块,若句子无错,则进行句法分析模块,另外,若句子只有单词拼写错误,也进行句法分析模块。(一)文本纠错模块的具体处理流程,按照如下步骤进行:1)英语文本语法常见错误的识别,利用任意的纠错工具包进行常见错误的识别;2)错误规则模式的添加。既定场景按照国内英语作文学习阶段和英文文本应用体裁两方面进行划分,国内英语作文学习阶段划分包括:小学生、初中生、高中生及以上这三个场景;英文文本应用体裁划分包括:书信、说明及记叙文、科学研究论文这三个场景。针对这两个方面的不同场景,添加相应的错误模式。进一步的,对于步骤2),英语写作场景的补充以及相应语法错误模式的识别纠错,可以根据用户的需求不断完善,用于任何的英语教育辅导程序。(二)句法分析模块主要利用专利一英语文本自动解析的相关技术实现。附图说明图1是本专利技术方法的总体逻辑流程图;图2是文本纠错模块具体处理流程图;图3是文本句法分析模块具体处理流程图。具体实施方式英文文本纠错和句法分析方法,主要包含文本纠错模块和句法分析模块,两者的逻辑关系见图1其中,文本纠错模块先进行普适语法的纠错,然后根据选择的应用场景的不同,进行附加语法的纠错;句法分析模块主要针对正确句子,给出其相关的句法分析,包括句子基本句型、句子组成结构、句子语序、短语依赖关系以及修饰词、固定搭配等信息。2.2.1模块一:文本纠错模块具体流程见图2,主要分为两个部分,第一部分先使用LanguageTool工具包进行常见问题的纠错,第二部分,根据不同应用场景,添加对应领域或者级别特定的错误规则。对于第一部分,英语文本语法常见错误的识别,我们利用LanguageTool工具包进行处理,调用该工具包就可实现常见的英文文本的纠错,但值得注意的是,选用其它的文本纠错工具包,效果基本是一致的,不脱离我们的处理过程,只是不同的调用方式而已。对于第二部分,错误规则模式的添加。我们既定场景按照国内英语作文学习阶段和英文文本应用体裁两方面进行划分,国内英语作文学习阶段划分包括:小学生、初中生、高中生及以上这三个场景;英文文本应用体裁划分包括:书信、说明及记叙文、科学研究论文这三个场景。针对这两个方面的不同场景,添加的错误模式侧重点不同,具体如下:A.按照国内英语作文学习阶段划分的场景,添加规则主要利用既定规则模式的识别添加,包括相应场景阶段下的语法词组搭配,常见写作错误等。可以利用任意的规则添加方法实现,如LanguageTool工具包支持的错误模式扩展,也可以使用其它任意的基于负实例规则模式添加,主要利用错误模式匹配规则,如:小学生常见错误模式play+乐器,乐器前缺少the,仅根据单词的组合(或正则匹配)形成负实例规则添加即可,而错误模式helpsb.todo,介词to多余,就需要单词help+sb.+to+词性标注结果VB(表示单词原形)来实现,对于名词单复数的错误模式,则就完全依赖于词性标注结果的组合判断,NNS(表示名词复数)+VBP(表示动词非第三人称单数)。B.按照英文文本应用体裁划分的场景,添加规则主要利用文体的不同,即句子的组成结构的不同,如:书信,将提示重点放在句子是否精简上,对句子含有的平均单词数量及词汇难度和常见度进行记录,词汇难度和常见度通过自己总结归纳的5000常见词汇对比得出,对于过长的从句进行切割划分提醒;而科学研究论文主要考察专业词汇的表达准确性,利用专业词汇的固定表达匹配模式给出,即总结归纳该领域的专业词汇,并给出该专业词汇同一文本中常见的一般同时本文档来自技高网
...

【技术保护点】
1.对英文文本进行纠错及句法分析的逻辑方法,其特征是:对英文文本的处理过程包括两个模块部分,一部分进行文本纠错,另一部分针对正确句子,给出其相关的句法分析。/n

【技术特征摘要】
1.对英文文本进行纠错及句法分析的逻辑方法,其特征是:对英文文本的处理过程包括两个模块部分,一部分进行文本纠错,另一部分针对正确句子,给出其相关的句法分析。


2.根据权利要求1所述的方法,其特征是:所述的文本纠错模块包括以下两个部分:
1)利用常见的英文文本纠错工具进行英语常见语法错误的识别;
2)附加错误规则模式的添加。


3.根据权利要求1所述的方法,其特征是:所述的句法分析模块利用英文文本正则表达式匹配以及依存句法分析结果,得到相关的句...

【专利技术属性】
技术研发人员:戴翰波李辉王丽
申请(专利权)人:武汉慧人信息科技有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1