一种解析英语长句的方法及系统技术方案

技术编号:26304575 阅读:60 留言:0更新日期:2020-11-10 20:00
本发明专利技术提供了一种解析英语长句的方法及系统,其方法包括:获取英语语料;识别所述英语语料中的语料连接词;根据所述语料连接词确定所述英语语料中包含的语义层级;分析所述英语语料的句子结构,根据所述句子结构识别所述英语语料中的主体词语;根据所述语料连接词、所述语义层级以及所述主体词语将所述英语语料转化为对应的多个英语短句;解析所述英语短句得到所述英语语料对应的语料语义。本发明专利技术通过将英语长句解析成多个英语短句可以直观的展示出英语长句中的多个语义层级,从而让英语初学者以及英语基础较差的学习者更加容易理解。

【技术实现步骤摘要】
一种解析英语长句的方法及系统
本专利技术涉及自然语言处理
,尤指一种解析英语长句的方法及系统。
技术介绍
熟练的掌握英语,已经成为我们必须具备的素质之一,我们虽然采用了多种方式提高自己的英语水平,但是效果却不尽如人意。对于英语初学者,在学习英语时,目前大多英语老师都是让学生死记硬背单词的各个释义各个短语的搭配、以及语法规则等学习内容。上述的单纯地靠记忆力进行学习对于结构比较简单以及简短的英语句子可能还比较有效,但是对于较长的英语句子,例如其中包含有定语从句、状语从句等多重语义层级的英语语料,依靠死记硬背掌握的知识理解起来有一定的难度。因此,需要一种解析英语长句的方法及系统辅助学生解析英语长句的语义。
技术实现思路
本专利技术的目的是提供一种解析英语长句的方法及系统,实现通过将英语长句解析成多个英语短句可以直观的展示出英语长句中的多个语义层级,从而让英语初学者以及英语基础较差的学习者更加容易理解。本专利技术提供的技术方案如下:本专利技术提供一种解析英语长句的方法,包括:获取英语语料本文档来自技高网...

【技术保护点】
1.一种解析英语长句的方法,其特征在于,包括:/n获取英语语料;/n识别所述英语语料中的语料连接词;/n根据所述语料连接词确定所述英语语料中包含的语义层级;/n分析所述英语语料的句子结构,根据所述句子结构识别所述英语语料中的主体词语;/n根据所述语料连接词、所述语义层级以及所述主体词语将所述英语语料转化为对应的多个英语短句;/n解析所述英语短句得到所述英语语料对应的语料语义。/n

【技术特征摘要】
1.一种解析英语长句的方法,其特征在于,包括:
获取英语语料;
识别所述英语语料中的语料连接词;
根据所述语料连接词确定所述英语语料中包含的语义层级;
分析所述英语语料的句子结构,根据所述句子结构识别所述英语语料中的主体词语;
根据所述语料连接词、所述语义层级以及所述主体词语将所述英语语料转化为对应的多个英语短句;
解析所述英语短句得到所述英语语料对应的语料语义。


2.根据权利要求1所述的解析英语长句的方法,其特征在于,还包括:
获取可以作为连接词的关键词,根据所述关键词建立关键词库;
获取包含连接词的英语样本,定义所述英语样本中的所述连接词为样本连接词并进行标记;
将所述英语样本与所述关键词库比对,确定所述英语样本中的样本关键词;
将所述样本连接词与所述样本关键词进行比对;
若所述样本关键词多于所述样本连接词,则根据所述英语样本的句式结构,分析所述样本连接词的连接词属性信息,以及非样本连接词的样本关键词的非连接词属性信息;
根据所述连接词属性信息和所述非连接词属性信息生成连接词识别模型。


3.根据权利要求2所述的解析英语长句的方法,其特征在于,将所述样本连接词与所述样本关键词进行比对具体包括:
分别统计所述样本连接词的连接词个数,以及所述样本关键词的关键词词个数,相同的样本连接词和样本关键词计算一次;
将所述连接词个数和所述关键词词个数进行比对;
分别统计每一个所述样本连接词出现的连接词次数,以及每一个所述样本关键词出现的关键词词次数;
将相同的样本连接词和样本关键词对应的所述连接词次数和所述关键词词次数进行比对。


4.根据权利要求2所述的解析英语长句的方法,其特征在于,识别所述英语语料中的语料连接词具体包括:
将所述英语语料与所述关键词库比对,确定所述英语语料中的语料关键词;
根据所述英语语料的句式结构,分析所述语料关键词的语料属性信息;
根据所述语料属性信息,结合所述连接词识别模型识别所述英语语料中语料连接词。


5.根据权利要求1-4任一项所述的解析英语长句的方法,其特征在于,还包括:
结合所述英语短句对所述英语语料进行解析。


6.一种解析英语长句的系统,其特征在于,包括:
语料获取模块,获取英语语料;
连接词识别模块,识别所述语料获取模块获取的所述英语语料中的语料连接词;
层级分析模块,根据所述连接词识别模块识别的所述语料连接词确定所述英语语料中包含的语义层级;
主体分析模块,分析所述语料获取模块获取的所述英语语料的句子结构,根据所述句子结构识别...

【专利技术属性】
技术研发人员:张平
申请(专利权)人:广东小天才科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1