一种汉语增强依存句法的方法及装置制造方法及图纸

技术编号:34968015 阅读:21 留言:0更新日期:2022-09-17 12:49
本发明专利技术公开了一种汉语增强依存句法的方法及装置,涉及自然语言处理技术领域。包括:获取待增强的句子;获取句子的基础依存句法结果;基于构建好的依存增强规则集与句子的基础依存句法结果进行匹配,得到待增强的句子的增强依存句法结果。本发明专利技术具有逻辑清晰、效率高、比较全面的优点,妥善解决了现有依存句法分析无法充分表达实词间的语义关系,增加了进一步研究和应用的工作量的问题。研究和应用的工作量的问题。研究和应用的工作量的问题。

【技术实现步骤摘要】
一种汉语增强依存句法的方法及装置


[0001]本专利技术涉及自然语言处理
,特别是指一种汉语增强依存句法的方法及装置。

技术介绍

[0002]句法分析是自然语言处理当中的关键技术之一,它是对输入文本的句子进行分析以得到其句法结构的过程。
[0003]依存句法分析是其中的一种表示形式,它用于分析输入句子的句法结构,将词语序列转化为树状的依存结构,来捕捉句子内部词语之间的修饰或搭配关系,描写句法结构。依存句法分析广泛应用于自然语言处理的多个领域,如搭配抽取、信息抽取等。
[0004]现有的依存句法分析在准确地反映句法关系、描述句法结构的同时,也带有一些浅层的语义表示。但依存句法所能表达的语义关系比较简单,一些实词之间的关系没有直接明确地表示出来,且缺乏对句法转换的抽象。如在面对一组句式转换的句子时,尽管实词之间的语义关系相同,但由于他们在句中所作成分的不同,使得依存标签不同。
[0005]现有的工作主要聚焦于英语增强依存句法的规范和系统,在汉语中还未见相关研究。

技术实现思路

[0006]本专利技术针对现有依存句法分析无法充分表达实词间的语义关系的问题,提出了本专利技术。
[0007]为解决上述技术问题,本专利技术提供如下技术方案:一方面,本专利技术提供了一种汉语增强依存句法的方法,该方法由电子设备实现,该方法包括:S1、获取待增强的句子。
[0008]S2、获取句子的基础依存句法结果。
[0009]S3、基于构建好的依存增强规则集与句子的基础依存句法结果进行匹配,得到待增强的句子的增强依存句法结果。
[0010]可选地,S2中的获取句子的基础依存句法结果包括:基于斯坦福依存句法框架,获取句子的基础依存句法结果。
[0011]可选地,S3中的依存增强规则集包括介词和连词的增强规则、并列项的增强规则、句式转换的增强规则、特殊句式的增强规则以及不确定句式的增强规则。
[0012]可选地,介词和连词的增强规则包括介词的增强规则以及连词的增强规则。
[0013]其中,介词的增强规则包括:获取句子中介词的依存标签,在介词的依存标签上添加介词提示,将依存标签与介词提示采用下划线连接。
[0014]连词的增强规则包括:获取句子中连词的依存标签,在连词的依存标签上添加连词提示,将依存标签与连词提示采用下划线连接。
[0015]可选地,并列项的增强规则包括:获取句子中存在并列依存关系的多个词语。
[0016]获取多个词语中任一词语与句子中支配词或从属词间的依存关系。
[0017]对其他存在并列依存关系的词语与支配词或从属词增加依存关系的依存弧;其中,其他存在并列依存关系的词语包括存在并列依存关系的多个词语中除了所获取的词语外的其他词语。
[0018]可选地,句式转换的增强规则包括被动句的增强规则、把字句的增强规则、形容词修饰语语修饰语的增强规则。
[0019]其中,被动句的增强规则包括:获取句子中的谓语以及被动主语,对谓语以及被动主语增加标签为dobj的依存弧;把字句的增强规则包括:获取句子中的动词以及由把字引导的宾语,对动词以及由把字引导的宾语增加标签为dobj的依存弧;形容词修饰语的增强规则包括:获取句子中由形容词修饰的中心语以及动词,对由形容词修饰的中心语以及动词增加标签为nsubj的依存弧;动词短语修饰语的增强规则包括:获取句子中由动词短语修饰的中心语以及动词,对由动词短语修饰的中心语以及动词增加标签为dobj的依存弧。
[0020]可选地,特殊句式的增强规则包括兼语句的增强规则、连动句的增强规则以及省略成分的增强规则。
[0021]其中,兼语句的增强规则包括:获取句子中的兼语以及兼语后的谓语,对兼语以及兼语后的谓语增加标签为nsubj的依存弧。
[0022]连动句的增强规则包括:获取句子中由两个及两个以上动词构成的谓语中的动词,对动词以及动词的主语增加标签为nsubj的依存弧。
[0023]省略成分的增强规则包括:获取句子中省略主语或宾语的小句,获取句子中小句的主语或宾语,对主语或宾语增加表示主语或宾语依存关系的依存弧。
[0024]可选地,不确定句式的增强规则包括:当需要添加或修改的依存关系不确定时,为依存关系增加UNC标记。
[0025]不确定句式的增强规则还包括:当为同一个词语添加的同一类依存关系存在两个及两个以上可能时,为依存关系增加ALT标记。
[0026]可选地,S3中的基于构建好的依存增强规则集与句子的基础依存句法结果进行匹配,得到待增强的句子的增强依存句法结果包括:S31、将句子的基础依存句法结果与构建好的依存增强规则集中的所有增强规则进行匹配,获取成功匹配的增强规则,将成功匹配的增强规则作用于句子的基础依存句法结果上。
[0027]S32、重复上述步骤S31,直到不产生新的成功匹配的增强规则,输出待增强的句子的增强依存句法结果。
[0028]另一方面,本专利技术提供了一种汉语增强依存句法的装置,该装置应用于实现汉语增强依存句法的方法,该装置包括:获取模块,用于获取待增强的句子。
[0029]基础结果获取模块,用于获取句子的基础依存句法结果。
[0030]输出模块,用于基于构建好的依存增强规则集与句子的基础依存句法结果进行匹配,得到待增强的句子的增强依存句法结果。
[0031]可选地,基础结果获取模块,进一步用于:基于斯坦福依存句法框架,获取句子的基础依存句法结果。
[0032]可选地,依存增强规则集包括介词和连词的增强规则、并列项的增强规则、句式转换的增强规则、特殊句式的增强规则以及不确定句式的增强规则。
[0033]可选地,介词和连词的增强规则包括介词的增强规则以及连词的增强规则。
[0034]其中,介词的增强规则包括:获取句子中介词的依存标签,在介词的依存标签上添加介词提示,将依存标签与介词提示采用下划线连接。
[0035]连词的增强规则包括:获取句子中连词的依存标签,在连词的依存标签上添加连词提示,将依存标签与连词提示采用下划线连接。
[0036]可选地,并列项的增强规则包括:获取句子中存在并列依存关系的多个词语。
[0037]获取多个词语中任一词语与句子中支配词或从属词间的依存关系。
[0038]对其他存在并列依存关系的词语与支配词或从属词增加依存关系的依存弧;其中,其他存在并列依存关系的词语包括存在并列依存关系的多个词语中除了所获取的词语外的其他词语。
[0039]可选地,句式转换的增强规则包括被动句的增强规则、把字句的增强规则、形容词修饰语语修饰语的增强规则。
[0040]其中,被动句的增强规则包括:获取句子中的谓语以及被动主语,对谓语以及被动主语增加标签为dobj的依存弧;把字句的增强规则包括:获取句子中的动词以及由把字引导的宾语,对动词以及由把字引导的宾语增加标签为dobj的依存弧;形容词修饰语的增强规则包括:获取句子中由形容词修饰的中心本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种汉语增强依存句法的方法,其特征在于,所述方法包括:S1、获取待增强的句子;S2、获取所述句子的基础依存句法结果;S3、基于构建好的依存增强规则集与所述句子的基础依存句法结果进行匹配,得到所述待增强的句子的增强依存句法结果。2.根据权利要求1所述的方法,其特征在于,所述S2中的获取所述句子的基础依存句法结果包括:基于斯坦福依存句法框架,获取所述句子的基础依存句法结果。3.根据权利要求1所述的方法,其特征在于,所述S3中的依存增强规则集包括介词和连词的增强规则、并列项的增强规则、句式转换的增强规则、特殊句式的增强规则以及不确定句式的增强规则。4.根据权利要求3所述的方法,其特征在于,所述介词和连词的增强规则包括介词的增强规则以及连词的增强规则;其中,所述介词的增强规则包括:获取句子中介词的依存标签,在所述介词的依存标签上添加介词提示,将所述依存标签与所述介词提示采用下划线连接;所述连词的增强规则包括:获取句子中连词的依存标签,在所述连词的依存标签上添加连词提示,将所述依存标签与所述连词提示采用下划线连接。5.根据权利要求3所述的方法,其特征在于,所述并列项的增强规则包括:获取句子中存在并列依存关系的多个词语;获取所述多个词语中任一词语与句子中支配词或从属词间的依存关系;对其他存在并列依存关系的词语与所述支配词或从属词增加所述依存关系的依存弧;其中,所述其他存在并列依存关系的词语包括存在并列依存关系的多个词语中除了所获取的词语外的其他词语。6.根据权利要求3所述的方法,其特征在于,所述句式转换的增强规则包括被动句的增强规则、把字句的增强规则、形容词修饰语的增强规则以及动词短语修饰语的增强规则;其中,所述被动句的增强规则包括:获取句子中的谓语以及被动主语,对所述谓语以及被动主语增加标签为dobj的依存弧;所述把字句的增强规则包括:获取句子中的动词以及由把字引导的宾语,对所述动词以及由把字引导的宾语增加标签为dobj的依存弧;所述形容词修饰语的增强规则包括:获取句子中由形容词修饰的中心语以及动...

【专利技术属性】
技术研发人员:余婧思师佳璐杨麟儿肖丹杨尔弘
申请(专利权)人:北京语言大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1