多意图识别方法及装置制造方法及图纸

技术编号：37852551 阅读：9 留言：0更新日期：2023-06-14 22:44

本发明专利技术涉及计算机技术领域，提供一种多意图识别方法及装置，方法包括：获取待识别问答语料；将所述待识别语料输入多意图识别模型，得到所述多意图识别模型输出的识别结果；其中，所述多意图识别模型是基于样本问答语料及其对应的多意图标签进行训练得到的，所述样本问答语料是基于目标领域知识图谱的本体信息确定的。本发明专利技术通过目标领域的知识图谱的本体信息获取样本语料，节省了大量的复杂工作，构造的多意图识别模型可以识别出用户问答语料中的多个问答意图，提高了多意图识别的准确性。性。性。

全部详细技术资料下载

【技术实现步骤摘要】
多意图识别方法及装置

[0001]本专利技术涉及计算机
，尤其涉及一种多意图识别方法及装置。

技术介绍

[0002]基于知识图谱的问答(Knowledge Base Question Answering，KBQA)，是一种给定自然语言问题，通过对问题进行语义理解和解析，进而利用知识库进行查询、推理得出答案的问答服务。其中，对于用户的询问意图，尤其是多个意图的识别是KBQA中需要解决的关键问题。
[0003]目前，多个意图的识别方式主要有两种，一种是基于语法语义分析与句法依存分析的规则匹配法，该方法需要根据知识图谱的数据结构预先设置大量的规则，对于规则范围内的询问意图具有良好的识别效果。但由于知识图谱用户之间的提问水平的差别，导致该方法的拓展性较弱，尤其是对于规则之外的问句，往往不能准确识别询问意图。此外，随着知识图谱本体数据与关系数据的改变，需要重新修改规则，造成较大的维护与更新难度。
[0004]另一种是基于深度学习的方法，该类方法主要有两种思路，一种是根据句法依存分析或断句模型切分问句，将多意图识别问题转化为若干个单意图识别，但这样做同样受限于知识图谱用户的提问水平；另一种思路是将多意图问题转化为文本多标签多分类问题，为充分提取用户问句的特征，该方法则需要大量的有标签的问答语料作为数据支撑，对于一个新建的知识图谱问答应用，这一点往往无法满足。

技术实现思路

[0005]本专利技术提供一种多意图识别方法及装置，用以解决现有技术中多意图识别方法中，对于不同领域的问答语料不易获取，

【技术保护点】

【技术特征摘要】
1.一种多意图识别方法，其特征在于，包括：获取待识别问答语料；将所述待识别语料输入多意图识别模型，得到所述多意图识别模型输出的识别结果；其中，所述多意图识别模型是基于样本问答语料及其对应的多意图标签进行训练得到的，所述样本问答语料是基于目标领域知识图谱的本体信息确定的。2.根据权利要求1所述的多意图识别方法，其特征在于，确定所述样本问答语料，包括：基于所述目标领域知识图谱的本体信息，确定查询意图集合；基于所述查询意图集合，确定所述样本问答语料。3.根据权利要求2所述的多意图识别方法，其特征在于，所述基于所述目标领域知识图谱的本体信息，确定查询意图集合，包括：基于所述目标领域知识图谱的本体信息，得到本体的属性以及本体间的关系；将所述本体的属性以及所述本体间的关系作为查询意图，得到所述查询意图集合，其中，所述查询意图集合包括多种查询意图组合，每种查询意图组合至少包括一个查询意图。4.根据权利要求2所述的多意图识别方法，其特征在于，所述基于所述查询意图集合，确定所述样本问答语料，包括：基于所述多种查询意图组合，生成多个初始问答语料；通过生成相似文本对所述多个初始问答语料进行扩充，得到多个样本问答语料。5.根据权利要求4所述的多意图识别方法，其特征在于，确定所述样本问答语料对应的多意图标签，包括：基于所述查询意图集合中查询意图的个数，确定所述多意图标签的位数；基于每个样本问答语料对应的查询意图...

【专利技术属性】
技术研发人员：谢水庚，李小超，刘明，
申请(专利权)人：北京航天云路有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人