句型识别方法及其系统技术方案

技术编号:19903413 阅读:47 留言:0更新日期:2018-12-26 02:54
本申请涉及使用计算机对自然语言进行处理的领域,公开了一种句型识别方法及其系统,该方法中,对待识别的句子进行分节和分段,判断该句子中每一段是否包含案例句型相应段的特征,以及,是否存在案例句型相应段的负信息,其中特征的判断包括包括对关键词、标点符号、词性特征和空间信息的判断。通过这种正向特征匹配和负信息判断相结合的方案,大大提高了句型识别的准确率。

【技术实现步骤摘要】
句型识别方法及其系统
本申请涉及使用计算机对自然语言进行处理的领域,特别涉及自然语言的句型识别。
技术介绍
在英语句型教学、写作评估及翻译批改的过程中,过去一般使用人工标注的方式,获取英语句型的语法信息。随着人工智能技术在教育领域的应用,智能化教学成了未来教育技术的发展方向。教师智能备课、计算机自动批改作业、学生个性化学习等系统,在英语教学中逐步得到了应用。这就需要对英语句子中的组成成分进行自动分析和识别,包括对句子中各个单词、词组、短语、从句等特征进行智能识别,并在此基础上正确识别出句子的句型。正确识别句型有助于备课、组卷、个性化学习等各种具体应用。目前虽然已经有了一些英语句型自动化识别技术,但这些现有技术存在句型识别准确率低的问题。
技术实现思路
本申请的目的在于提供一种句型识别方法及其系统,提高了句型识别的准确率。为了解决上述问题,本申请公开了一种句型识别方法,包括:对于每一个待识别的句子,根据逗号位置,将该句子分为至少一个小节;对于每一个小节,根据关键词位置,将该小节分为至少一段;依次将一个句子中每一个小节的每一段与预先设置的案例句型中每一个小节的每一段进行匹配,根据匹配结果确定本文档来自技高网...

【技术保护点】
1.一种句型识别方法,其特征在于,包括:对于每一个待识别的句子,根据逗号位置,将该句子分为至少一个小节;对于每一个小节,根据关键词位置,将该小节分为至少一段;依次将一个句子中每一个小节的每一段与预先设置的案例句型中每一个小节的每一段进行匹配,根据匹配结果确定该句子的句型;其中,所述匹配包括:判断该句子中每一段是否包含所述案例句型相应段的特征,和/或,是否存在所述案例句型相应段的负信息。

【技术特征摘要】
1.一种句型识别方法,其特征在于,包括:对于每一个待识别的句子,根据逗号位置,将该句子分为至少一个小节;对于每一个小节,根据关键词位置,将该小节分为至少一段;依次将一个句子中每一个小节的每一段与预先设置的案例句型中每一个小节的每一段进行匹配,根据匹配结果确定该句子的句型;其中,所述匹配包括:判断该句子中每一段是否包含所述案例句型相应段的特征,和/或,是否存在所述案例句型相应段的负信息。2.根据权利要求1所述的句型识别方法,其特征在于,所述将该句子分为至少一个小节的步骤之前,还包括以下步骤:导入待识别文本;对所述待识别文本进行预处理,得到至少一个待识别的句子;对所述待识别的句子进行数字化处理。3.根据权利要求2所述的句型识别方法,其特征在于,所述预处理包括:根据预先设定的标点和特定字符的位置,将所述待处理文本拆分为至少一个完整的待识别的句子。4.根据权利要求3所述的句型识别方法,其特征在于,所述预处理还包括:识别所述待识别的句子中的缩写词,并将识别出的缩写词替换为单词原形。5.根据权利要求2所述的句型识别方法,其特征在于,所述数字化处理进一步包括:基于预先设置的词组库,识别所述待识别的句子中包含的所有词组,并对识别出的词组在所述待识别的句子中所担当的成分进行数字化标注;基于预先设置的单词库,识别所述待识别的句子中各单词的词性,并对识别出的单词词性进行数字化标注。6.根据权利要求1所述的句型识别方法,其特征在于,所述将该句子分为至少一个小节的步骤之前,还包括:基于预先设置的关键词库,识别出所述待识别的句子中包含的所有关键词;根据识别出的所有关键词和所述待识别的句子句末标点,与预先设置的案例句型库中的各案例句型进行匹配,...

【专利技术属性】
技术研发人员:张新华王朝选柴鹏飞
申请(专利权)人:浙江蓝鸽科技有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1