基于依存句法的语义识别方法、设备和可读存储介质技术

技术编号:26731141 阅读:24 留言:0更新日期:2020-12-15 14:33
本申请公开了一种基于依存句法的语义识别方法、设备和可读存储介质,所述基于依存句法的语义识别方法包括:获取待处理语句和所述待处理语句对应的关联语句,并抽取所述关联语句对应的关键实体,进而对所述待处理语句进行依存句法分析,以对所述待处理语句的句子主干抽取,获得所述待处理语句对应的目标句子主干,进而基于所述关键实体和所述目标句子主干,生成所述待处理语句对应的完整语义数据,以对所述待处理语句进行语义识别。本申请解决了语义识别效率低的技术问题。

【技术实现步骤摘要】
基于依存句法的语义识别方法、设备和可读存储介质
本申请涉及金融科技(Fintech)的人工智能领域,尤其涉及一种基于依存句法的语义识别方法、设备和可读存储介质。
技术介绍
随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术(如分布式、区块链Blockchain、人工智能等)应用在金融领域,但金融业也对技术提出了更高的要求,如对金融业对应待办事项的分发也有更高的要求。随着计算机软件和人工智能的不断发展,人工智能的应用领域也越来越广泛,在基于人工智能的对话系统中,在智能客服提出上文语句后,用户回复的下文语句通常存在成分缺失的情况,进而为了正确识别下文语句的语义,通常将上文语句和下文语句进行拼接,获得拼接语句,进而通过语义识别模型对拼接语句进行识别,即可确定下文语句的语义,其中,语义识别模型是基于预先标注好了的上下文配对数据进行训练获得的,但是,若当前的对话场景更换为新的对话场景时,则需要重新标注上下文配对数据,以对语义识别模型进行维护更新,也即,语义识别模型仅适用于已经进行了上下文配对数据标注了的对话场景,而在对话系统中,由于用户的多样化,时常会产生新的对话场景,而由于对话系统中语义识别通常是实时进行的,而标注上下文配对数据和进行模型维护更新通常需要大量时间,进而由于当前的语义识别模型却难以适用于新的对话场景,将导致语义识别模型难以及时进行准确地语义识别,进而导致语义识别的效率较低。
技术实现思路
本申请的主要目的在于提供一种基于依存句法的语义识别方法、设备和可读存储介质,旨在解决现有技术中语义识别效率低的技术问题。为实现上述目的,本申请提供一种基于依存句法的语义识别方法,所述基于依存句法的语义识别方法应用于基于依存句法的语义识别设备,所述基于依存句法的语义识别方法包括:获取待处理语句和所述待处理语句对应的关联语句,并抽取所述关联语句对应的关键实体;对所述待处理语句进行依存句法分析,以对所述待处理语句的句子主干抽取,获得所述待处理语句对应的目标句子主干;基于所述关键实体和所述目标句子主干,生成所述待处理语句对应的完整语义数据,以对所述待处理语句进行语义识别。本申请还提供一种基于依存句法的语义识别装置,所述基于依存句法的语义识别装置为虚拟装置,且所述基于依存句法的语义识别装置应用于基于依存句法的语义识别设备,所述基于依存句法的语义识别装置包括:第一抽取模块,用于获取待处理语句和所述待处理语句对应的关联语句,并抽取所述关联语句对应的关键实体;第二抽取模块,用于对所述待处理语句进行依存句法分析,以对所述待处理语句的句子主干抽取,获得所述待处理语句对应的目标句子主干;生成模块,用于基于所述关键实体和所述目标句子主干,生成所述待处理语句对应的完整语义数据,以对所述待处理语句进行语义识别。本申请还提供一种基于依存句法的语义识别设备,所述基于依存句法的语义识别设备为实体设备,所述基于依存句法的语义识别设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述基于依存句法的语义识别方法的程序,所述基于依存句法的语义识别方法的程序被处理器执行时可实现如上述的基于依存句法的语义识别方法的步骤。本申请还提供一种可读存储介质,所述可读存储介质上存储有实现基于依存句法的语义识别方法的程序,所述基于依存句法的语义识别方法的程序被处理器执行时实现如上述的基于依存句法的语义识别方法的步骤。本申请提供了一种基于依存句法的语义识别方法、设备和可读存储介质,相比于现有技术采用的基于预先标注好了的上下文配对数据进行训练获得的语义识别模型,对下文语句进行语义识别的技术手段,本申请在获取待处理语句和所述待处理语句对应的关联语句之后,首先抽取所述关联语句对应的关键实体,进而对所述待处理语句进行依存句法分析,以对所述待处理语句的句子主干抽取,获得所述待处理语句对应的目标句子主干,其中,需要说明的是,在所述待处理语句中除所述目标句子主干之外的非句子主干部分对语义识别的贡献度较小,且对语义识别存在干扰,进而实现了基于依存句法分析的方法,在待处理语句中剔除对语义识别的贡献度小的非句子主干部分的目的,使得目标句子主干更加贴近于待处理语句的真实语义,进而基于所述关键实体和所述目标句子主干,生成所述待处理语句对应的完整语义数据,也即,基于所述关联语句中抽取的关键实体,对目标句子主干中缺失的句子成分进行填补,使得填补后的目标句子主干具备待处理语句的完整语义,获得完整语义数据,进而基于完整语义数据,即可实现对待处理语句的准确语义识别,其中,需要说明的是,本申请中整个语义识别过程是基于依存句法分析进行的,且依存句法分析可适用于所有对话场景,进而在当前的对话场景更改为新的对话场景时,无需重新进行上下文配对数据的标注,可对下文语句快速进行准确地语义识别,克服了现在技术中基于预先标注好了的上下文配对数据进行训练获得的语义识别模型,对下文语句进行语义识别时,若当前的对话场景更改为新的对话场景,则由于当前的语义识别模型难以适用新的对话场景,将导致语义识别模型难以及时进行准确地语义识别的技术缺陷,提高了语义识别的效率。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请基于依存句法的语义识别方法第一实施例的流程示意图;图2为本申请基于依存句法的语义识别方法中所述待分析语句对应的依存关系树的示意图;图3为本申请基于依存句法的语义识别方法第二实施例的流程示意图;图4为本申请实施例方案涉及的硬件运行环境的设备结构示意图。本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。本申请实施例提供一种基于依存句法的语义识别方法,在本申请基于依存句法的语义识别方法的第一实施例中,参照图1,所述基于依存句法的语义识别方法包括:步骤S10,获取待处理语句和所述待处理语句对应的关联语句,并抽取所述关联语句对应的关键实体;在本实施例中,需要说明的是,所述基于依存句法的语义识别方法应用于智能对话系统,所述关联语句为对话时的上文语句,所述待处理语句为预处理后的对话时的下文语句,也即,所述待处理语句和所述关联语句为上下文关系,其中,预处理的目的为在所述待处理语句中去除干扰进行依存句法分析的背景成分。获取待处理语句和所述待处理语句对应的关联语句,并抽取所述关联语句对应的关键实体,具体地,在人机对话系统中收集所述待处理语句,并将所述待处理语句的下文语句作为关联语句,进而基于预设实体成分,在所述关联语句中抽取关键实体,本文档来自技高网...

【技术保护点】
1.一种基于依存句法的语义识别方法,其特征在于,所述基于依存句法的语义识别方法包括:/n获取待处理语句和所述待处理语句对应的关联语句,并抽取所述关联语句对应的关键实体;/n对所述待处理语句进行依存句法分析,以对所述待处理语句的句子主干抽取,获得所述待处理语句对应的目标句子主干;/n基于所述关键实体和所述目标句子主干,生成所述待处理语句对应的完整语义数据,以对所述待处理语句进行语义识别。/n

【技术特征摘要】
1.一种基于依存句法的语义识别方法,其特征在于,所述基于依存句法的语义识别方法包括:
获取待处理语句和所述待处理语句对应的关联语句,并抽取所述关联语句对应的关键实体;
对所述待处理语句进行依存句法分析,以对所述待处理语句的句子主干抽取,获得所述待处理语句对应的目标句子主干;
基于所述关键实体和所述目标句子主干,生成所述待处理语句对应的完整语义数据,以对所述待处理语句进行语义识别。


2.如权利要求1所述基于依存句法的语义识别方法,其特征在于,所述完整语义数据至少包括一完整语义语句,所述关键实体至少包括一关键填充词,
所述基于所述关键实体和所述目标句子主干,生成所述待处理语句对应的完整语义语句的步骤包括:
判断所述目标句子主干是否缺失句子主干成分;
若缺失,则基于所述关键填充词,对所述目标句子主干进行缺失成分填补,获得所述完整语义语句。


3.如权利要求2所述基于依存句法的语义识别方法,其特征在于,所述基于所述关键填充词,对所述目标句子主干进行缺失成分填补,获得所述完整语义语句的步骤包括:
确定所述目标句子主干的主干缺失成分位置;
将所述关键填充词填充至所述主干缺失成分位置,获得所述目标句子主干对应的第一填补句子主干;
基于所述第一填补句子主干,生成所述完整语义语句。


4.如权利要求2所述基于依存句法的语义识别方法,其特征在于,所述基于所述关键填充词,对所述目标句子主干进行缺失成分填补,获得所述完整语义语句的步骤包括:
将所述关键填充词和所述目标句子主干进行拼接,获得所述完整语义语句。


5.如权利要求2所述基于依存句法的语义识别方法,其特征在于,所述基于所述关键填充词,对所述目标句子主干进行缺失成分填补,获得所述完整语义语句的步骤包括:
将所述关键填充词和所述目标句子主干输入预设语句填补模型,对所述目标句子主干的缺失成分进行填补,获得第二填补句子主干;
基于所述第二填补句子主干,生成所述完整语义语句。


6.如权利要求1所述基于依存句法的语义识别方法,其特征在于,所述对所述待处理语句进行依存句法分析,以对所述待处理语句的句子主干抽取,获得所述待处理语句对应的目标句子主干的步骤包括:
对所述待处理语句进行依存句法分析,获得所述待处理语句对应的依存句法分析结果;
基于所述依存句法分析结果,抽取所述待处理语句对应的所述目标句子主干。


7.如权利要求6所述基于依存句法的语义识别方法,其特征在于,所述对所述待处理语句进行依存句法分析,获得所述待处理语句对应的依存句法分析结果的步骤包括:
对所述待处理语句进行向量化,获得向量化语句;
基于预设依存关系判别模型,对所述向量化语句进行依存关系判别,获得依存关系判别结果;
基于预设依存关系类型预测模型和所述依存关系判别结果,对所述向量化语句进行依存关系类型预测,获得所述依存关系类型预测结果。


8.如权利要求7所述基于依存句法的语义识别方法,其特征在于,所述预设依存关系判别模型包括第一特征提取模型、第一全连接网络、第二全连接网络和第一双仿射变换网络,
所述基于预设依...

【专利技术属性】
技术研发人员:汤耀华周楠楠杨海军徐倩
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1