【技术实现步骤摘要】
自然语言句法分析方法及系统
本专利技术涉及句法分析
,具体来说涉及一种自然语言句法分析方法,以及一种用于实现该分析方法的自然语言句法分析系统。
技术介绍
自然语言处理是人工智能和语言学领域的分支学科,是利用计算机工具对人类特有的书面形式和口头形式的自然语言信息进行各种处理和加工的技术。自然语言处理大致分为两个层面,一个是浅层分析,如分词,词性标注。这种技术只需对句子的局部范围进行分析处理,已经属于成熟技术。另一个层面是对语言进行深层的处理,需要对句子的句法、语义、语用进行全局分析。目前,哈工大开发的LTP和StanfordParser处于业内领先水平。其可以很好的解决短句的句法分析,而对于长句的句法分析,精确度仍然有待提高。如何开发出一种能够对长句进行准确分析的分析系统和分析方法,克服现有技术存在缺陷的分析系统是本领域技术人员需要研究的方向。
技术实现思路
本专利技术的目的是提供一种句法分析方法,以克服现有技术所存在的上述问题。其采用的技术方案是:一种自然语言句法分析方法,包括如下步骤:S1:对输入文本句进行分词操作,提取构成输入文本句的各个单词;S2:对S1所 ...
【技术保护点】
一种自然语言句法分析方法,其特征在于包括如下步骤:S1:对输入文本句进行分词操作,提取构成输入文本句的各个单词;S2:对S1所得各个单词进行词性标注,获取各个单词的词性;S3:统计两两单词之间构成依存关系的频次,统计各单词与另一单词的词性之间构成依存关系的频次,统计两两单词的词性之间构成依存的频次;S4:在输入文本句中的各单词之间生成依存句法边,所述S3中所得两两单词之间构成依存关系的频次,设定依存关系DrC、DrD、DrE、DrF的频次分别为f(c)、f(d)、f(e)、f(f),那么词语i与词语j的权值为(f(c) + f(d) + f(e) + f(f))/4);计算 ...
【技术特征摘要】
1.一种自然语言句法分析方法,其特征在于包括如下步骤:S1:对输入文本句进行分词操作,提取构成输入文本句的各个单词;S2:对S1所得各个单词进行词性标注,获取各个单词的词性;S3:统计两两单词之间构成依存关系的频次,统计各单词与另一单词的词性之间构成依存关系的频次,统计两两单词的词性之间构成依存的频次;S4:在输入文本句中的各单词之间生成依存句法边,所述S3中所得两两单词之间构成依存关系的频次,设定依存关系DrC、DrD、DrE、DrF的频次分别为f(c)、f(d)、f(e)、f(f),那么词语i与词语j的权值为(f(c)+f(d)+f(e)+f(f))/4);计算出句子中各依存句法边的权值后,取最大的作为唯一的边,加入有向图中,以最大权值为唯一的边生成有向树图;S5:在有向树图中以Prim最小生成树算法,计算出最小生成树;S6:对S5所得最小生成树格式化输出。2.如权利要求1所述一种自然语言句法分析方法,其特征在于还包括步骤S7;S7:对S6所得格式化输出进行可视化展现。3.一种自然语言句法分析系统,其特征在于:包括分词单元(1),词性标注单元(2),依存分析单元(3),有向树图构建单元(4),最小生成树构建单元(5)和格式化...
【专利技术属性】
技术研发人员:陈浩,
申请(专利权)人:汇仕电子商务上海有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。