多意图识别方法及装置制造方法及图纸

技术编号:37852551 阅读:9 留言:0更新日期:2023-06-14 22:44
本发明专利技术涉及计算机技术领域,提供一种多意图识别方法及装置,方法包括:获取待识别问答语料;将所述待识别语料输入多意图识别模型,得到所述多意图识别模型输出的识别结果;其中,所述多意图识别模型是基于样本问答语料及其对应的多意图标签进行训练得到的,所述样本问答语料是基于目标领域知识图谱的本体信息确定的。本发明专利技术通过目标领域的知识图谱的本体信息获取样本语料,节省了大量的复杂工作,构造的多意图识别模型可以识别出用户问答语料中的多个问答意图,提高了多意图识别的准确性。性。性。

【技术实现步骤摘要】
多意图识别方法及装置


[0001]本专利技术涉及计算机
,尤其涉及一种多意图识别方法及装置。

技术介绍

[0002]基于知识图谱的问答(Knowledge Base Question Answering,KBQA),是一种给定自然语言问题,通过对问题进行语义理解和解析,进而利用知识库进行查询、推理得出答案的问答服务。其中,对于用户的询问意图,尤其是多个意图的识别是KBQA中需要解决的关键问题。
[0003]目前,多个意图的识别方式主要有两种,一种是基于语法语义分析与句法依存分析的规则匹配法,该方法需要根据知识图谱的数据结构预先设置大量的规则,对于规则范围内的询问意图具有良好的识别效果。但由于知识图谱用户之间的提问水平的差别,导致该方法的拓展性较弱,尤其是对于规则之外的问句,往往不能准确识别询问意图。此外,随着知识图谱本体数据与关系数据的改变,需要重新修改规则,造成较大的维护与更新难度。
[0004]另一种是基于深度学习的方法,该类方法主要有两种思路,一种是根据句法依存分析或断句模型切分问句,将多意图识别问题转化为若干个单意图识别,但这样做同样受限于知识图谱用户的提问水平;另一种思路是将多意图问题转化为文本多标签多分类问题,为充分提取用户问句的特征,该方法则需要大量的有标签的问答语料作为数据支撑,对于一个新建的知识图谱问答应用,这一点往往无法满足。

技术实现思路

[0005]本专利技术提供一种多意图识别方法及装置,用以解决现有技术中多意图识别方法中,对于不同领域的问答语料不易获取,识别的拓展性差的缺陷,实现不同领域的问答语句的精确多意图识别。
[0006]本专利技术提供一种多意图识别方法,包括:
[0007]获取待识别问答语料;
[0008]将所述待识别语料输入多意图识别模型,得到所述多意图识别模型输出的识别结果;
[0009]其中,所述多意图识别模型是基于样本问答语料及其对应的多意图标签进行训练得到的,所述样本问答语料是基于目标领域知识图谱的本体信息确定的。
[0010]根据本专利技术提供的一种多意图识别方法,确定所述样本问答语料,包括:
[0011]基于所述目标领域知识图谱的本体信息,确定查询意图集合;
[0012]基于所述查询意图集合,确定所述样本问答语料。
[0013]根据本专利技术提供的一种多意图识别方法,所述基于所述目标领域知识图谱的本体信息,确定查询意图集合,包括:
[0014]基于所述目标领域知识图谱的本体信息,得到本体的属性以及本体间的关系;
[0015]将所述本体的属性以及所述本体间的关系作为查询意图,得到所述查询意图集
合,其中,所述查询意图集合包括多种查询意图组合,每种查询意图组合至少包括一个查询意图。
[0016]根据本专利技术提供的一种多意图识别方法,所述基于所述查询意图集合,确定所述样本问答语料,包括:
[0017]基于所述多种查询意图组合,生成多个初始问答语料;
[0018]通过生成相似文本对所述多个初始问答语料进行扩充,得到多个样本问答语料。
[0019]根据本专利技术提供的一种多意图识别方法,确定所述样本问答语料对应的多意图标签,包括:
[0020]基于所述查询意图集合中查询意图的个数,确定所述多意图标签的位数;
[0021]基于每个样本问答语料对应的查询意图组合进行多标签编码,得到所述每个样本问答语料对应的多意图标签。
[0022]根据本专利技术提供的一种多意图识别方法,所述多意图识别模型的训练过程包括:
[0023]获取所述样本问答语料及其对应的多意图标签,并提取所述样本问答语料的语料特征;
[0024]将所述样本问答语料的语料特征输入至初始多意图识别模型,得到所述样本问答语料对应的预测多意图标签;
[0025]根据所述多意图标签和所述预测多意图标签,更新所述初始多意图识别模型的模型参数,以训练得到所述多意图识别模型。
[0026]本专利技术还提供一种多意图识别装置,包括:
[0027]输入模块,用于获取待识别问答语料;
[0028]输出模块,用于将所述待识别语料输入多意图识别模型,得到所述多意图识别模型输出的识别结果;
[0029]其中,所述多意图识别模型是基于样本问答语料及其对应的多意图标签进行训练得到的,所述样本问答语料是基于目标领域知识图谱的本体信息确定的。
[0030]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述多意图识别方法。
[0031]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述多意图识别方法。
[0032]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述多意图识别方法。
[0033]本专利技术提供的多意图识别方法及装置,通过多意图识别模型可以对任意目标领域内的问答语料,实现多意图识别。对于一个新建的知识图谱问答应用,往往是没有问答语料的,此时需要构建大量的带标签的问答语料作为数据支撑,然后才能进行意图识别。由于本专利技术多意图识别模型在训练时,只需要通过任意目标领域的已有知识图谱构建样本问答语料,无需受限于知识图谱用户的提问水平和数据量,在此基础上训练深度学习模型,训练好的多意图识别模型可以准确地识别出用户问答语料中的多个问答意图。
附图说明
[0034]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0035]图1是本专利技术实施例提供的多意图识别方法的流程示意图;
[0036]图2是本专利技术实施例提供的多意图识别模型的训练流程示意图;
[0037]图3是本专利技术实施例提供的多意图识别模型的结构示意图;
[0038]图4是本专利技术实施例提供的电影图谱的结构示意图;
[0039]图5是本专利技术提供的多意图识别装置的结构示意图;
[0040]图6是本专利技术提供的电子设备的结构示意图。
具体实施方式
[0041]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0042]下面结合图1

图4描述本专利技术的多意图识别方法,如图1所示,本专利技术实施例公开了一种多意图识别方法,其至少包括如下步骤:
[0043]步骤101、获取待识别问答语料;
...

【技术保护点】

【技术特征摘要】
1.一种多意图识别方法,其特征在于,包括:获取待识别问答语料;将所述待识别语料输入多意图识别模型,得到所述多意图识别模型输出的识别结果;其中,所述多意图识别模型是基于样本问答语料及其对应的多意图标签进行训练得到的,所述样本问答语料是基于目标领域知识图谱的本体信息确定的。2.根据权利要求1所述的多意图识别方法,其特征在于,确定所述样本问答语料,包括:基于所述目标领域知识图谱的本体信息,确定查询意图集合;基于所述查询意图集合,确定所述样本问答语料。3.根据权利要求2所述的多意图识别方法,其特征在于,所述基于所述目标领域知识图谱的本体信息,确定查询意图集合,包括:基于所述目标领域知识图谱的本体信息,得到本体的属性以及本体间的关系;将所述本体的属性以及所述本体间的关系作为查询意图,得到所述查询意图集合,其中,所述查询意图集合包括多种查询意图组合,每种查询意图组合至少包括一个查询意图。4.根据权利要求2所述的多意图识别方法,其特征在于,所述基于所述查询意图集合,确定所述样本问答语料,包括:基于所述多种查询意图组合,生成多个初始问答语料;通过生成相似文本对所述多个初始问答语料进行扩充,得到多个样本问答语料。5.根据权利要求4所述的多意图识别方法,其特征在于,确定所述样本问答语料对应的多意图标签,包括:基于所述查询意图集合中查询意图的个数,确定所述多意图标签的位数;基于每个样本问答语料对应的查询意图...

【专利技术属性】
技术研发人员:谢水庚李小超刘明
申请(专利权)人:北京航天云路有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1