一种融合句法分析和语义角色剪枝的意图理解方法技术

技术编号:31380479 阅读:16 留言:0更新日期:2021-12-15 11:26
本发明专利技术涉及自然语言处理中的语义分析技术领域,且公开了一种融合句法分析和语义角色剪枝的意图理解方法,包括预处理模块、语义匹配模块与剪枝模块,根据句子成分剪枝和语义角色剪枝得到的文本与原输入文本联合编码建模,句子成分剪枝保留句子的主语、谓语、宾语等主要句子成分,语义角色剪枝保留句中的核心论元,包括施事、受事、范围、动作开始、动作结束及其他动词相关的论元角色,剪枝的作用是剔除非句子主要成分或核心论元的其他部分,凸显句子的主要语义。本发明专利技术其优点在于针对句子过长、描述词过多或用户存在多意图的输入句子进行强化语义;通过依存句法分析和语义角色标注标记表现句子语义的主要词语以联合输入编码的形式增强语义信息。形式增强语义信息。形式增强语义信息。

【技术实现步骤摘要】
一种融合句法分析和语义角色剪枝的意图理解方法


[0001]本专利技术涉及自然语言处理中的语义分析
,具体为一种融合句法分析和语义角色剪枝的意图理解方法。

技术介绍

[0002]意图理解是指基于用户输入文本从语义的角度准确理解用户的意图,目前,意图理解的常用方法是通过语义相似度模型将用户输入与知识库中的标准问匹配,进而确定用户语义,但当出现用户输入存在句子过长、描述词过多或用户存在多意图的情况下,直接用语义相似度模型将用户输入文本与知识库标准问匹配,很难在知识库中找到相应的标准问,导致难以确定用户的意图,依存句法分析和语义角色标注是自然语言处理中的关键底层技术,依存句法分析的基本任务是识别句子中词汇之间的依存关系,确定句子的句法结构,语义角色标注主要研究句子中各成分与谓词之间的关系,并且用语义角色来描述他们之间的关系,通过依存句法分析对用户输入文本进行句法结构分析,确定句子的主体结构,通过语义角色标注得到句子中的论元,确定句子中的施事、受事等论元角色,通过句法关系进行剪枝,去除句子中冗余的描述词、判断是否存在多个意图,将结果输入到语义相似度模型中,增强语义信息,进而提高意图理解的准确率。

技术实现思路

[0003](一)解决的技术问题针对现有技术的不足,本专利技术提供了一种融合句法分析和语义角色剪枝的意图理解方法,具备针对句子过长、描述词过多或用户存在多意图的输入句子进行强化语义与通过依存句法分析和语义角色标注标记表现句子语义的主要词语以联合输入编码的形式增强语义信息的优点,解决了针对句子过长、描述词过多或用户存在多意图时难以处理的问题。
[0004](二)技术方案为实现上述目的,本专利技术提供如下技术方案:一种融合句法分析和语义角色剪枝的意图理解方法,包括预处理模块、语义匹配模块与剪枝模块,所述剪枝模块包含剪枝算法,句子成分剪枝包含以下步骤:步骤1:确定中心词;步骤2:确定主语;步骤3:确定宾语;语义角色剪枝包含以下步骤:步骤1:确定句子谓词,进行标记;步骤2:确定核心论元,保留句中的核心论元,包括施事、受事、范围、动作开始、动作结束及其他动词相关的论元角色,并进行标记;步骤3:对其他与谓词不直接相关的论元,如时间、地点、目的、程度等进行剪枝。
[0005]优选的,融合句法分析和语义角色剪枝的意图理解系统主要包括预处理模块、剪枝模块、语义匹配模块、结果输出模块。
[0006]优选的,所述确定中心词以获取依存句法树的根节点,作为初始中心词、判断是否有依存于中心词且为连动关系的词,如果存在,加入到中心词列表中。
[0007]优选的,所述确定主语以从初始中心词出发,获取依存于初始中心词、依存关系为主谓关系的词,作为主语词。
[0008]优选的,所述从初始中心词出发,获取依存于初始中心词、依存关系为动宾关系的词,作为宾语词,判断是否有依存于宾语词且依存关系为并列关系的词,如果存在,加入到宾语词列表中。
[0009]优选的,所述语义匹配模块将剪枝后得到的句子成分、语义角色与原始句子共同输入到语义匹配模型。
[0010]与现有技术相比,本专利技术提供了一种融合句法分析和语义角色剪枝的意图理解方法,具备以下有益效果:1、该融合句法分析和语义角色剪枝的意图理解方法,该融合句法分析和语义角色剪枝的意图理解方法在使用时,用户输入信息文本,信息文本经过预处理中进行处理输出,输入的语句中分词会进行词性标注、依存语法分析、语义角色标注三个环节的处理,依存句法分析出句子成分,语义角色标注处理后得到语义角色,其中句子成分与语义角色为剪枝部分,经过剪枝算法处理后的语句会再通过语义匹配,最终输出用户的意图。
[0011]2、该融合句法分析和语义角色剪枝的意图理解方法,本专利技术对用户输入文本进行依存句法分析和语义角色标注,根据句法结构和语义角色对输入句子进行剪枝,分别得到表达句子语义的句子成分和语义角色,与原始句子共同输入到语义相似度模型进行意图匹配,通过句子成分和语义角色增强句子的语义信息,以提高意图理解的准确率,其优点在于针对句子过长、描述词过多或用户存在多意图的输入句子进行强化语义;通过依存句法分析和语义角色标注标记表现句子语义的主要词语以联合输入编码的形式增强语义信息。
附图说明
[0012]图1为本专利技术融合句法分析和语义角色剪枝的意图理解系统框架方法示意图。
具体实施方式
[0013]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0014]请参阅图1,一种融合句法分析和语义角色剪枝的意图理解方法,包括预处理模块、语义匹配模块与剪枝模块,所述剪枝模块包含剪枝算法,句子成分剪枝包含以下步骤:步骤1:确定中心词,获取依存句法树的根节点,作为初始中心词,判断是否有依存于中心词且为连动关系的词,如果存在,加入到中心词列表中;步骤2:确定主语,从初始中心词出发,获取依存于初始中心词、依存关系为主谓关
系的词,作为主语词,判断是否有依存于主语词且依存关系为并列关系的词,如果存在,加入到主语词列表中;步骤3:确定宾语,从初始中心词出发,获取依存于初始中心词、依存关系为动宾关系的词,作为宾语词,判断是否有依存于宾语词且依存关系为并列关系的词,如果存在,加入到宾语词列表中;语义角色剪枝包含以下步骤:步骤1:确定句子谓词,进行标记;步骤2:确定核心论元,保留句中的核心论元,包括施事、受事、范围、动作开始、动作结束及其他动词相关的论元角色,并进行标记;步骤3:对其他与谓词不直接相关的论元,如时间、地点、目的、程度等进行剪枝。
[0015]语义匹配:将剪枝后得到的句子成分、语义角色与原始句子共同输入到语义匹配模型结果输出:根据语义匹配结果匹配到的标准问意图得到用户意图。
[0016]工作原理:该融合句法分析和语义角色剪枝的意图理解方法在使用时,用户输入信息文本,信息文本经过预处理中进行处理输出,输入的语句中分词会进行词性标注、依存语法分析、语义角色标注三个环节的处理,依存句法分析出句子成分,语义角色标注处理后得到语义角色,其中句子成分与语义角色为剪枝部分,经过剪枝算法处理后的语句会再通过语义匹配,最终输出用户的意图,本专利技术对用户输入文本进行依存句法分析和语义角色标注,根据句法结构和语义角色对输入句子进行剪枝,分别得到表达句子语义的句子成分和语义角色,与原始句子共同输入到语义相似度模型进行意图匹配,通过句子成分和语义角色增强句子的语义信息,以提高意图理解的准确率,其优点在于针对句子过长、描述词过多或用户存在多意图的输入句子进行强化语义;通过依存句法分析和语义角色标注标记表现句子语义的主要词语以联合输入编码的形式增强语义信息。
[0017]尽管已经示出和描述了本专利技术的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本专利技术的原理和精神的情况下可以对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种融合句法分析和语义角色剪枝的意图理解方法,其特征在于:包括预处理模块、语义匹配模块、语义角色剪枝、句子成分剪枝、结果输出模块与剪枝模块,所述句子成分剪枝包含以下步骤:步骤1:确定中心词;步骤2:确定主语;步骤3:确定宾语;所述语义角色剪枝包含以下步骤:步骤1:确定句子谓词,进行标记;步骤2:确定核心论元,保留句中的核心论元,包括施事、受事、范围、动作开始、动作结束及其他动词相关的论元角色,并进行标记;步骤3:对其他与谓词不直接相关的论元,如时间、地点、目的、程度等进行剪枝。2.根据权利要求1所述的一种融合句法分析和语义角色剪枝的意图理解方法,其特征在于:融合句法分析和语义角色剪枝的意图理解系统主要包括预处理模块、剪枝模块、语义匹配模块、结果输出模块。3.根据权利要求1所述的一种融合句法分析和语义角色剪枝的意图理解方...

【专利技术属性】
技术研发人员:张丹董晓飞张学强曹峰
申请(专利权)人:中国信息通信研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1