意图识别方法、装置、电子设备、存储介质制造方法及图纸

技术编号:39053312 阅读:13 留言:0更新日期:2023-10-12 19:45
本公开涉及计算机技术领域,尤其涉及计算机技术领域,尤其涉及自然语言处理、深度学习等人工智能技术领域。具体公开一种意图识别方法、装置、电子设备、存储介质。具体实现方案为:基于预设意图判定规则对待识别提示文本进行意图识别,得到第一意图识别结果;基于预先训练得到的深度学习模型对待识别提示文本进行意图识别,得到第二意图识别结果;通过查询大语言模型进行意图标注得到的历史意图识别结果,对待识别提示文本进行意图识别,得到第三意图识别结果;对多路意图识别结果进行融合得到最终的意图识别结果。通过多路意图识别,进行意图识别结果的融合,同时提升了系统基于用户提示词理解意图分类的性能和意图识别召回的覆盖率。的覆盖率。的覆盖率。

【技术实现步骤摘要】
意图识别方法、装置、电子设备、存储介质


[0001]本公开涉及计算机
,尤其涉及计算机
,尤其涉及自然语言处理、深度学习等人工智能
具体公开了一种意图识别方法、装置、电子设备、存储介质。

技术介绍

[0002]在一些人机交互的应用场景中,例如用户需要机器帮助写作的场景,机器人需要对用户输入的提示词(prompt)进行意图识别。意图识别即根据用户prompt的理解,进行意图分类,系统根据意图分类决策prompt是否需要补全上下文、澄清内部专名词实体概念,以便让下游的大语言模型更好地理解当前用户的prompt指令意图。
[0003]但现有技术中,通常仅基于规则判定或者模型预测的方法进行意图分类,意图识别的方式比较单一,导致基于规则判断方法泛化效果差、导致召回不足,或者基于模型预测方法造成的预测性能差,以及模型训练成本高的问题。

技术实现思路

[0004]本公开提供了一种意图识别方法、装置、电子设备、存储介质。
[0005]根据本公开的第一方面,提供了一种意图识别方法,包括:
[0006]获取待识别提示文本;
[0007]对所述待识别提示文本进行意图识别,包括:
[0008]基于预设意图判定规则对所述待识别提示文本进行意图识别,得到第一意图识别结果;
[0009]基于预先训练得到的深度学习模型对所述待识别提示文本进行意图识别,得到第二意图识别结果;
[0010]通过查询大语言模型进行意图标注得到的历史意图识别结果,对所述待识别提示文本进行意图识别,得到第三意图识别结果;
[0011]对所述第一意图识别结果、所述第二意图识别结果、所述第三意图识别结果进行融合,得到最终的意图识别结果。
[0012]根据本公开的第二方面,提供了一种意图识别装置,包括:
[0013]获取模块,被配置为获取待识别提示文本;
[0014]意图识别模块,被配置为对所述待识别提示文本进行意图识别,包括:
[0015]意图规则判定子模块,被配置为基于预设意图判定规则对所述待识别提示文本进行意图识别,得到第一意图识别结果;
[0016]意图模型预测子模块,被配置为基于预先训练得到的深度学习模型对所述待识别提示文本进行意图识别,得到第二意图识别结果;
[0017]意图语义匹配子模块,被配置为通过查询大语言模型进行意图标注得到的历史意图识别结果,对所述待识别提示文本进行意图识别,得到第三意图识别结果;
[0018]融合模块,被配置为对所述第一意图识别结果、所述第二意图识别结果、所述第三
意图识别结果进行融合,得到最终的意图识别结果。
[0019]根据本公开的第三方面,提供了一种电子设备,包括:
[0020]至少一个处理器;以及
[0021]与所述至少一个处理器通信连接的存储器;其中,
[0022]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述技术方案中任一项所述的方法。
[0023]根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述技术方案中任一项所述的方法。
[0024]根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述技术方案中任一项所述的方法。
[0025]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0026]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0027]图1是本公开实施例中的意图识别方法的步骤示意图;
[0028]图2是本公开实施例中的意图识别方法的系统流程图;
[0029]图3是本公开实施例中的智能创作场景的操作界面图;
[0030]图4是用来实现本公开实施例的意图识别方法的电子设备的框图。
具体实施方式
[0031]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0032]现有的意图识别方案通常包括以下两种:
[0033]方案1:基于用户的提示词prompt人工进行意图分类的标注,总结归纳规则,基于规则集合通过正则匹配的方式,将符合某些规则的prompt判定为对应的意图分类。但这种通过规则判定的方式泛化效果差,导致召回不足。
[0034]方案2:对用户的prompt人工进行意图分类的标注,利用标注数据训练多分类模型,通过模型预测的方式,来给出用户prompt的意图分类。通过模型的方式,预测性能差,一般秒级别返回预测结果,且模型训练成本高,迭代周期长,一次训练要标注千级别的数据样本。
[0035]针对上述采用单一意图识别方式导致泛化效果差,或者通过模型预测模型训练成本高、预测准确率较低的技术问题,本公开提供了一种意图识别方法,如图1所示,包括:
[0036]步骤S101,获取待识别提示文本;
[0037]步骤S102,对待识别提示文本进行意图识别,包括:
[0038]步骤S102A,基于预设意图判定规则对待识别提示文本进行意图识别,得到第一意图识别结果;
[0039]步骤S102B,基于预先训练得到的深度学习模型对待识别提示文本进行意图识别,得到第二意图识别结果;
[0040]步骤S102C,通过查询大语言模型(Large Language Model,LLM)进行意图标注得到的历史意图识别结果,对待识别提示文本进行意图识别,得到第三意图识别结果;
[0041]步骤S103,对第一意图识别结果、第二意图识别结果、第三意图识别结果进行融合,得到最终的意图识别结果。
[0042]如图2所示意图识别流程,本实施例中针对规则判定方式泛化性不足的问题,将模型预测方式整合入系统,同时还整合了语义匹配的意图识别方式,通过三种不同的识别方式同时对用户输入的提示文本(prompt)进行意图识别,最后对多路的结果进行融合得到最优的意图识别结果。需要说明的是,步骤S102A、步骤S102B、步骤S102C这三个意图识别步骤是并列的,不分先后顺序。具体地,本实施例中的意图识别方法可以应用于一些智能写作场景,例如基于用户的提示词判断是否需要引入上文,当用户提示词为“对以上文档内容进行总结,意图分类结果为“需引入文档上文内容”;若用户提示词为“将上面一段话扩写至1000字”,意图分类结果为“需引入文档上文内容”。
[0043]具体地,通过规则判定意图,是指通过规则模板解析本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种意图识别方法,包括:获取待识别提示文本;对所述待识别提示文本进行意图识别,包括:基于预设意图判定规则对所述待识别提示文本进行意图识别,得到第一意图识别结果;基于预先训练得到的深度学习模型对所述待识别提示文本进行意图识别,得到第二意图识别结果;通过查询大语言模型进行意图标注得到的历史意图识别结果,对所述待识别提示文本进行意图识别,得到第三意图识别结果;对所述第一意图识别结果、所述第二意图识别结果、所述第三意图识别结果进行融合,得到最终的意图识别结果。2.根据权利要求1所述的方法,其中,所述对所述待识别提示文本进行意图识别之前,还包括:对所述待识别提示文本进行词性标注。3.根据权利要求2所述的方法,其中,所述对所述待识别提示文本进行意图识别之前,并在对所述待识别提示文本进行词性标注之后,还包括:基于第二历史意图识别结果对所述待识别提示文本进行语义匹配,若所述待识别提示文本中的关键词命中所述第二历史意图识别结果,则返回所述第二历史意图识别结果中所述关键词对应的数值作为最终的所述意图识别结果。4.根据权利要求1

3中任意一项所述的方法,其中,所述对所述第一意图识别结果、所述第二意图识别结果、所述第三意图识别结果进行融合,得到最终的意图识别结果之后,还包括:获取所述第一意图识别结果、所述第二意图识别结果、所述第三意图识别结果中未产出意图分类结果的数据;调用所述大语言模型对所述未产出意图分类结果的数据进行意图分类标注,得到所述历史意图识别结果。5.根据权利要求4所述的方法,其中,所述调用所述大语言模型对所述未产出意图分类结果的数据进行意图分类标注,得到所述历史意图识别结果包括:调用所述大语言模型自动归纳出所述未产出意图分类结果的数据对应的意图分类正则表达式;基于所述意图分类正则表达式生成所述未产出意图分类结果的数据对应的第二提示文本;将所述第二提示文本转换为语义向量,并将所述第二提示文本对应的标注数据转换为索引值;建立所述语义向量和所述索引值之间的索引关系作为所述历史意图识别结果。6.根据权利要求4所述的方法,其中,所述对所述第一意图识别结果、所述第二意图识别结果、所述第三意图识别结果进行融合,得到最终的意图识别结果之后,还包括:通过异步入库方式将所述第一意图识别结果、所述第二意图识别结果、所述第三意图识别结果存储到数据库中。
7.根据权利要求1

6中任意一项所述的方法,其中,所述对所述第一意图识别结果、所述第二意图识别结果、所述第三意图识别结果进行融合,得到最终的意图识别结果包括:基于各意图识别结果的优先级,从所述第一意图识别结果、所述第二意图识别结果、所述第三意图识别结果中确定最终的所述意图识别结果。8.根据权利要求7所述的方法,其中,所述各意图识别结果的优先级包括:所述第三意图识别结果的优先级高于所述第一意图识别结果,所述第一意图识别结果的优先级高于所述第二意图识别结果。9.一种意图识别装置,包括:获取模块,被配置为获取待识别提示文本;意图识别模块,被配置为对所述待识别提示文本进行意图识别,包括:意图规则判定子模块,被配置为基于预设意图判定规则对所述待识别提示文本进行意图识别,得到第一意图识别结果;意图模型预测子模块,被配置为基于预先训练得到的深度学习模型对所述待识别提示文本进行意图识别,得到第二意图识别结果;意图语义匹配子模块,被配置为通过查询大语言模型进行意图标注得到的历史意图识别结果,对所述待识别提示文本进行意图识别,得到第三意图识...

【专利技术属性】
技术研发人员:王杰
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1