语义解析方法及装置、计算机可读存储介质、电子设备制造方法及图纸

技术编号:20160714 阅读:38 留言:0更新日期:2019-01-19 00:13
本发明专利技术涉及计算机技术领域,提供了一种语义解析方法、装置、计算机可读介质及电子设备,该语义解析方法包括:获取用户输入的查询语句所对应的多个意图;获取与各所述意图对应的实体,将所述实体分别插入到与各所述意图对应的语义槽位中,以形成多个意图槽位组合;提取各所述意图槽位组合的特征,以形成特征向量;将所述特征向量输入至训练好的排序模型,以获取与所述查询语句相关度最高的目标意图槽位组合,将所述目标意图槽位组合作为所述查询语句的语义解析结果。本发明专利技术通过排序的方法对意图分类和槽位抽取同时进行优化,提高语义解析的准确率。

【技术实现步骤摘要】
语义解析方法及装置、计算机可读存储介质、电子设备
本专利技术涉及计算机领域,特别涉及一种语义解析方法、语义解析装置、计算机可读存储介质及电子设备。
技术介绍
人工智能(ArtificialIntelligence,简称AI)是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。随着人工智能技术的不断发展,人们对方便快捷、高效准确的智能服务的需求越来越强烈。自然语言作为人类表达自己思想最方便、最自然的方式,已经逐渐成为智能服务领域最主流的人机交互方式。通常人们希望通过自然语言信息作为输入,而不是输入复杂的字符代码,进而获得相应的输出。由于自然语言具有开放性、随意性,表达方式多样,对自然语言进行语义解析,从而识别其真实含义,对于智能服务提供而言显得尤为重要。鉴于此,本领域亟需开发一种新的语义解析方法及装置。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本专利技术的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种语义解析方法、语义解析装置、计算机可读存储介质及电子设备,进而至少在一定程度上提高语义解析的正确性,以进一步提升用户体验。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本专利技术实施例的一个方面,提供一种语义解析方法,包括:获取用户输入的查询语句所对应的多个意图;获取与各所述意图对应的实体,将所述实体分别插入到与各所述意图对应的语义槽位中,以形成多个意图槽位组合;提取各所述意图槽位组合的特征,以形成特征向量;将所述特征向量输入至训练好的排序模型,以获取与所述查询语句相关度最高的目标意图槽位组合,将所述目标意图槽位组合作为所述查询语句的语义解析结果。根据本专利技术实施例的一个方面,提供了一种语义解析装置,包括:意图分析模块,用于获取用户输入的查询语句所对应的多个意图;意图槽位组合生成模块,用于获取与各所述意图对应的实体,将所述实体分别插入到与各所述意图对应的语义槽位中,以形成多个意图槽位组合;特征向量生成模块,用于提取各所述意图槽位组合的特征,以形成特征向量;排序模块,用于将所述特征向量输入至训练好的排序模型,以获取与所述查询语句相关度最高的目标意图槽位组合,将所述目标意图槽位组合作为所述查询语句的语义解析结果。在本专利技术的一些实施例,基于前述方案,所述意图分析模块包括:分类单元,用于将所述查询语句输入至意图分类器,以获取多个分类结果及所述多个分类结果对应的准确率;判断单元,用于判断所述多个分类结果的准确率与一预设值的大小关系;意图获取单元,用于当判定存在准确率大于所述预设值的目标分类结果时,将所述目标分类结果作为所述意图。在本专利技术的一些实施例,基于前述方案,所述意图槽位组合生成模块包括:抽选单元,用于从所述查询语句中抽选备选实体;过滤单元,用于根据所述备选实体之间的包含关系,对所述备选实体进行过滤,以获得与各所述意图对应的实体。在本专利技术的一些实施例,基于前述方案,所述排序模块包括:相关度获取单元,用于将所述特征向量输入至所述排序模型,以获取所述多个意图槽位组合与所述查询语句的相关度;排序单元,用于将所述多个意图槽位组合根据所述相关度从高到低排序;选择单元,用于选取相关度最高的意图槽位组合作为所述目标意图槽位组合。在本专利技术的一些实施例,基于前述方案,所述装置还包括:模型获取模块,用于获取初始模型;样本获取模块,用于获取查询语句样本和与所述查询语句样本对应的多个意图槽位组合样本;样本相关度计算模块,用于计算所述多个意图槽位组合样本与所述查询语句样本的样本相关度;样本特征提取模块,用于提取所述多个意图槽位组合样本的特征,以形成样本特征向量;模型训练模块,用于将所述样本特征向量与所述样本相关度输入至所述初始模型,以对所述初始模型进行训练,得到所述排序模型。在本专利技术的一些实施例,基于前述方案,所述样本相关度计算模块包括:相关度获取单元,用于对所述多个意图槽位组合样本打分,并根据所述多个意图槽位组合样本对应的打分值获取所述样本相关度。在本专利技术的一些实施例,基于前述方案,所述相关度获取单元包括:样本获取单元,用于获取所述多个意图槽位组合样本中意图正确的意图槽位组合样本;打分单元,用于根据所述意图正确的意图槽位组合样本所对应的语义槽位的F值打分。在本专利技术的一些实施例,基于前述方案,所述打分值为所述意图正确的意图槽位组合样本所对应的语义槽位的F1值。在本专利技术的一些实施例,基于前述方案,所述打分值与所述样本相关度成正比。在本专利技术的一些实施例,基于前述方案,所述模型训练模块包括:训练单元,用于将所述样本特征向量作为输入向量,并将所述样本相关度作为输出向量,输入至所述初始模型,以对所述初始模型进行训练,得到所述排序模型。在本专利技术的一些实施例,基于前述方案,所述特征向量生成模块包括:特征提取单元,用于提取各所述意图槽位组合的至少一个预设特征,并根据各所述意图槽位组合的所述预设特征形成所述特征向量。在本专利技术的一些实施例,基于前述方案,所述预设特征包括:实体与语义槽位的共现关系特征;实体、实体来源和语义槽位的共现关系特征;语义槽位中实体的长度特征;实体组合或意图槽位组合中抽取的项目序列特征;语义槽位填充值的长度占查询语句长度的比例特征;语义槽位中的实体是否包含其它实体或被其它实体包含;语义槽位中实体开始或结束位置附近抽取的项目序列特征;循环神经网络语音模型的分数特征;大词汇连续语言识别模型的分数特征;意图分类的得分特征。根据本专利技术实施例的一方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中所述的语义解析方法。根据本专利技术实施例的一方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中所述的语义解析方法。由上述技术方案可知,本公开示例性实施例中的语义解析方法及装置、计算机可读存储介质、电子设备至少具备以下优点和积极效果:本专利技术实施例通过对用户输入的查询语句进行分析,获得查询语句对应的多个意图;然后对每个意图进行实体识别,并将获得的实体分别插入到与各个意图对应的语义槽位中,形成多个意图槽位组合;最后提取意图槽位组合的特征以形成与查询语句对应的特征向量,并将特征向量输入至训练好的排序模型,以获得与查询语句匹配的目标意图槽位组合,该目标意图槽位组合即为查询语句的语义解析结果。本专利技术实施例的语义解析方法一方面能够对所有意图槽位组合进行排序获得目标意图槽位组合,实现对意图分类和槽位抽取同时进行优化,提高语义解析的正确性;另一方面能够通过多个特征的抽取方法对意图槽位组合进行特征提取,进一步提高结果的正确性。本专利技术应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。显而易见地,下面描述中的附图仅仅是本专利技术的一些实施本文档来自技高网...

【技术保护点】
1.一种语义解析方法,其特征在于,包括:获取用户输入的查询语句所对应的多个意图;获取与各所述意图对应的实体,将所述实体分别插入到与各所述意图对应的语义槽位中,以形成多个意图槽位组合;提取各所述意图槽位组合的特征,以形成特征向量;将所述特征向量输入至训练好的排序模型,以获取与所述查询语句相关度最高的目标意图槽位组合,将所述目标意图槽位组合作为所述查询语句的语义解析结果。

【技术特征摘要】
1.一种语义解析方法,其特征在于,包括:获取用户输入的查询语句所对应的多个意图;获取与各所述意图对应的实体,将所述实体分别插入到与各所述意图对应的语义槽位中,以形成多个意图槽位组合;提取各所述意图槽位组合的特征,以形成特征向量;将所述特征向量输入至训练好的排序模型,以获取与所述查询语句相关度最高的目标意图槽位组合,将所述目标意图槽位组合作为所述查询语句的语义解析结果。2.根据权利要求1所述的语义解析方法,其特征在于,获取用户输入的查询语句所对应的多个意图,包括:将所述查询语句输入至意图分类器,以获取多个分类结果及所述多个分类结果对应的准确率;判断所述多个分类结果的准确率与一预设值的大小关系;若判定存在准确率大于所述预设值的目标分类结果,则将所述目标分类结果作为所述意图。3.根据权利要求1所述的语义解析方法,其特征在于,获取与各所述意图对应的实体,包括:从所述查询语句中抽选备选实体;根据所述备选实体之间的包含关系,对所述备选实体进行过滤,以获得与各所述意图对应的实体。4.根据权利要求1所述的语义解析方法,其特征在于,将所述特征向量输入至训练好的排序模型,以获取与所述查询语句相关度最高的目标意图槽位组合,包括:将所述特征向量输入至所述排序模型,以获取所述多个意图槽位组合与所述查询语句的相关度;将所述多个意图槽位组合根据所述相关度从高到低排序;选取相关度最高的意图槽位组合作为所述目标意图槽位组合。5.根据权利要求1-4任一项所述的语义解析方法,其特征在于,所述方法还包括通过训练获得所述排序模型的步骤,包括:获取初始模型;获取查询语句样本和与所述查询语句样本对应的多个意图槽位组合样本;计算所述多个意图槽位组合样本与所述查询语句样本的样本相关度;提取所述多个意图槽位组合样本的特征,以形成样本特征向量;将所述样本特征向量与所述样本相关度输入至所述初始模型,以对所述初始模型进行训练,得到所述排序模型。6.根据权利要求5所述的语义解析方法,其特征在于,计算所述多个意图槽位组合样本与所述查询语句样本的样本相关度,包括:对所述多个意图槽位组合样本打分,并根据所述多个意图槽位组合样本对应的打分值获取所述样本相关度。7.根据权利要求6所述的语义解析方法,其特征在于,对所述多个意图槽位组合样本打分,包括:获取所述多个意图槽位组合样本中意图正确的意图槽位组合样本;...

【专利技术属性】
技术研发人员:田乐张程譚翊章
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1