一种英语口语的语法校正方法及装置制造方法及图纸

技术编号:21914229 阅读:23 留言:0更新日期:2019-08-21 12:30
本发明专利技术涉及一种英语口语的语法校正方法及装置,所述方法包括:获取用户的英语口语文本;对所述英语口语文本进行断句和分词处理得到目标文本;在所述目标文本中定位存在语法错误的目标单词;当判断所述目标单词存在语法错误时,对所述目标单词进行校正。本发明专利技术可以对用户的英语口语文本的语法进行检查,校正用户的英语口音,提升用户的口语正确性。

A Grammar Correction Method and Device for Oral English

【技术实现步骤摘要】
一种英语口语的语法校正方法及装置
本专利技术涉及计算机
,特别是涉及一种英语口语的语法校正方法及装置。
技术介绍
在英语口语学习或者交流当中,学生经常会发生一些英语口语上的语法错误。但目前缺乏对语法方面的针对性评估及反馈,降低了学生的英语学习效率。
技术实现思路
基于此,有必要针对目前缺乏对语法方面的针对性评估的问题,提供一种英语口语的语法校正方法及装置。一种英语口语的语法校正方法,所述方法包括:获取用户的英语口语文本;对所述英语口语文本进行断句和分词处理得到目标文本;在所述目标文本中定位存在语法错误的目标单词;当判断所述目标单词存在语法错误时,对所述目标单词进行校正。优选的,所述对所述英语口语文本进行断句和分词处理得到目标文本,包括:对所述英语口语文本进行断句得到第一文本;对所述第一文本进行单词划分,并对对划分后的单词进行词性划分后形成目标文本。优选的,所述在所述目标文本中定位存在语法错误的目标单词之后,所述方法还包括:提取与所述目标单词关联的特征信息,所述特征信息包括上下文N元词信息、N-gram词性信息和与所述目标单词相对应的语法错误类型信息;其中,当所述语法错误为冠词错误时,所述特征信息包括所述目标单词所隶属名词短语的核心词信息、前面最接近的动词、形容词修饰信息;当所述语法错误为介词错误时,所述特征信息包括所述目标单词前面最接近的动词、后面的短语信息;所述当判断所述目标单词存在语法错误时,对所述目标单词进行校正,具体为:当基于所述特征信息判断所述目标单词存在语法错误时,对所述目标单词进行校正。优选的,所述基于所述特征信息判断所述目标单词存在语法错误,具体为:将所述特征信息包括的上下文N元词信息、N-gram词性信息和与所述目标单词相对应的语法错误类型信息输入至朴素贝叶斯模型,当所述朴素贝叶斯模型输出预设信息时,判断所述目标单词存在语法错误。优选的,所述当判断所述目标单词存在语法错误之后,对所述目标单词进行校正之前,所述方法还包括:采用先验知识得到用于替换所述目标单词的相似单词;将所述相似单词与所述目标单词所在位置的上下文形成N-gram词组合或者经过词性标记形成N-gram词性组合;由大数据集训练的语言模型评估所述N-gram词组合或者N-gram词性组合出现的概率;如果概率值最大的所述N-gram词组合或者N-gram词性组合不包含所述目标单词,则判断所述目标单词存在语法错误。一种英语口语的语法校正装置,所述装置包括:获取模块,用于获取用户的英语口语文本;处理模块,用于对所述英语口语文本进行断句和分词处理得到目标文本;定位模块,用于在所述目标文本中定位存在语法错误的目标单词;校正模块,用于当判断所述目标单词存在语法错误时,对所述目标单词进行校正。优选的,所述处理模块用于:对所述英语口语文本进行断句得到第一文本;对所述第一文本进行单词划分,并对对划分后的单词进行词性划分后形成目标文本。优选的,所述装置还包括:提取模块,用于提取与所述目标单词关联的特征信息,所述特征信息包括上下文N元词信息、N-gram词性信息和与所述目标单词相对应的语法错误类型信息;其中,当所述语法错误为冠词错误时,所述特征信息包括所述目标单词所隶属名词短语的核心词信息、前面最接近的动词、形容词修饰信息;当所述语法错误为介词错误时,所述特征信息包括所述目标单词前面最接近的动词、后面的短语信息;所述校正模块具体用于:当基于所述特征信息判断所述目标单词存在语法错误时,对所述目标单词进行校正。优选的,所述校正模块还用于:将所述特征信息包括的上下文N元词信息、N-gram词性信息和与所述目标单词相对应的语法错误类型信息输入至朴素贝叶斯模型,当所述朴素贝叶斯模型输出预设信息时,判断所述目标单词存在语法错误。优选的,所述装置还包括:替换模块,用于采用先验知识得到用于替换所述目标单词的相似单词;形成模块,用于将所述相似单词与所述目标单词所在位置的上下文形成N-gram词组合或者经过词性标记形成N-gram词性组合;评估模块,用于由大数据集训练的语言模型评估所述N-gram词组合或者N-gram词性组合出现的概率;判断模块,用于如果概率值最大的所述N-gram词组合或者N-gram词性组合不包含所述目标单词,则判断所述目标单词存在语法错误。本专利技术中,在获取用户的英语口语文本后,可以对所述英语口语文本进行断句和分词处理得到目标文本;在所述目标文本中定位存在语法错误的目标单词;当判断所述目标单词存在语法错误时,对所述目标单词进行校正。由此,可以对用户的英语口语文本的语法进行检查,校正用户的英语口音,提升用户的口语正确性。附图说明图1为一实施例的英语口语的语法校正方法的流程图;图2为一实施例的英语口语的语法校正装置的结构图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。图1为一实施例的英语口语的语法校正方法的流程图。如图1所示,该方法包括:步骤120,获取用户的英语口语文本;步骤140,对英语口语文本进行断句和分词处理得到目标文本;步骤160,在目标文本中定位存在语法错误的目标单词;步骤180,当判断目标单词存在语法错误时,对目标单词进行校正。本专利技术中,在获取用户的英语口语文本后,可以对所述英语口语文本进行断句和分词处理得到目标文本;在所述目标文本中定位存在语法错误的目标单词;当判断所述目标单词存在语法错误时,对所述目标单词进行校正。由此,可以对用户的英语口语文本的语法进行检查,校正用户的英语口音,提升用户的口语正确性。本实施例中,可以通过语音识别系统获取用户的英语口语文本。本实施例中,步骤140对英语口语文本进行断句和分词处理得到目标文本,包括:对英语口语文本进行断句得到第一文本;对第一文本进行单词划分,并对对划分后的单词进行词性划分后形成目标文本。其中,可以通过句子边界检错进行断句。由于英语口语文本中并无标点符号,且语法解析是以句子为单位,因此断句操作是后续流程的基础。对第一文本进行单词划分并作词性标记。单词划分是对句子的进一步切分,语法解析的基本单位是单词。在语法结构中,单词搭配实质上是词性之间的搭配,词性标记操作可借助现有工具(如美国斯坦福大学的工具StanfordParser),也可根据线上系统收集的大量文本数据经过标签训练得到模型再预测词性。本实施例中,在目标文本中定位存在语法错误的目标单词之后,该方法还包括:提取与所述目标单词关联的特征信息,所述特征信息包括上下文N元词信息、N-gram词性信息和与所述目标单词相对应的语法错误类型信息;其中,当所述语法错误为冠词错误时,所述特征信息包括所述目标单词所隶属名词短语的核心词信息、前面最接近的动词、形容词修饰信息;当所述语法错误为介词错误时,所述特征信息包括所述目标单词前面最接近的动词、后面的短语信息;当判断目标单词存在语法错误时,对目标单词进行校正,具体为:当基于特征信息判断目标单词存在语法错误时,对目标单词进行校正。本实施例中,基于特征信息判断目标单词存在语法错误,具体为:将特征信息包括的上下文N元词信息、N-gram词性信息和与目标单词相对本文档来自技高网...

【技术保护点】
1.一种英语口语的语法校正方法,其特征在于,所述方法包括:获取用户的英语口语文本;对所述英语口语文本进行断句和分词处理得到目标文本;在所述目标文本中定位存在语法错误的目标单词;当判断所述目标单词存在语法错误时,对所述目标单词进行校正。

【技术特征摘要】
1.一种英语口语的语法校正方法,其特征在于,所述方法包括:获取用户的英语口语文本;对所述英语口语文本进行断句和分词处理得到目标文本;在所述目标文本中定位存在语法错误的目标单词;当判断所述目标单词存在语法错误时,对所述目标单词进行校正。2.根据权利要求1所述的方法,其特征在于,所述对所述英语口语文本进行断句和分词处理得到目标文本,包括:对所述英语口语文本进行断句得到第一文本;对所述第一文本进行单词划分,并对对划分后的单词进行词性划分后形成目标文本。3.根据权利要求1所述的方法,其特征在于,所述在所述目标文本中定位存在语法错误的目标单词之后,所述方法还包括:提取与所述目标单词关联的特征信息,所述特征信息包括上下文N元词信息、N-gram词性信息和与所述目标单词相对应的语法错误类型信息;其中,当所述语法错误为冠词错误时,所述特征信息包括所述目标单词所隶属名词短语的核心词信息、前面最接近的动词、形容词修饰信息;当所述语法错误为介词错误时,所述特征信息包括所述目标单词前面最接近的动词、后面的短语信息;所述当判断所述目标单词存在语法错误时,对所述目标单词进行校正,具体为:当基于所述特征信息判断所述目标单词存在语法错误时,对所述目标单词进行校正。4.根据权利要求3所述的方法,其特征在于,所述基于所述特征信息判断所述目标单词存在语法错误,具体为:将所述特征信息包括的上下文N元词信息、N-gram词性信息和与所述目标单词相对应的语法错误类型信息输入至朴素贝叶斯模型,当所述朴素贝叶斯模型输出预设信息时,判断所述目标单词存在语法错误。5.根据权利要求1所述的方法,其特征在于,所述当判断所述目标单词存在语法错误之后,对所述目标单词进行校正之前,所述方法还包括:采用先验知识得到用于替换所述目标单词的相似单词;将所述相似单词与所述目标单词所在位置的上下文形成N-gram词组合或者经过词性标记形成N-gram词性组合;由大数据集训练的语言模型评估所述N-gram词组合或者N-gram词性组合出现的概率;如果概率值最大的所述N-gram词组合或者N-gram...

【专利技术属性】
技术研发人员:彭书勇方敏蔡雅莉薛文韬惠寅华林远东
申请(专利权)人:苏州驰声信息科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1