一种结合大模型的对话意图识别方法技术

技术编号:38904075 阅读:31 留言:0更新日期:2023-09-22 14:22
本发明专利技术提供了一种结合大模型的对话意图识别方法,通过以下技术方案实现:预置意图文本和对应的意图处理模块,所述预置意图处理模块包括系统意图和用户自定义意图,所述系统意图为通用意图,所述用户意图为用户自定义意图;通过语音识别模块识别用户对话内容,形成文本形式;通过文本相似性计算模块对用户对话内容形成的文本与预置意图文本进行匹配计算,将匹配结果与设定的匹配阈值比较;所述语音合成与播报模块将接收到的信息通过TTS合成为语音信息,并进行播报。利用大模型的海量知识,对匹配失败的用户意图进行更好回答,提升对话系统的智能性以及用户体验感。统的智能性以及用户体验感。统的智能性以及用户体验感。

【技术实现步骤摘要】
一种结合大模型的对话意图识别方法


[0001]本专利技术涉及一种结合大模型的对话意图识别方法,属于意图识别


技术介绍

[0002]意图识别,对话机器人与用户进行对话时需要识别用户的意图,根据用户意图在设置的多个意图模块中选中用户意图进行回复,该模块也是对话业务的核心。预置意图如天气预报、导航引领、点餐服务等。包含接入的第三方服务或者是为当前机器人设置的专有意图。
[0003]现有的对话流程设计大多采用直接的意图识别,根据识别结果选择对应的意图模块进行对话回复,或者采用文本相似性进行意图分类文本比较,根据比较得到的结果选择对应的意图模块进行对话回复。该流程的不足之处是预置意图是有限的,有很多用户对话是没有对应的意图的,而当前研究火热的大模型学习海量知识可以回答用户大部分问题,因此可以将大模型应用到对话流程,在匹配现有意图模块失败时选择大模型回答,提高对话的智能性和用户体验度。

技术实现思路

[0004]本专利技术目的是提供了一种结合大模型的对话意图识别方法,利用大模型的海量知识,对匹配失败的用户意图进行更好回答,提升对话系统的智能性以及用户体验感。
[0005]本专利技术为实现上述目的,通过以下技术方案实现:
[0006]步骤1:预置意图文本和对应的意图处理模块,所述预置意图处理模块包括系统意图和用户自定义意图,所述系统意图为通用意图,所述用户意图为用户自定义意图;
[0007]步骤2:通过语音识别模块识别用户对话内容,形成文本形式;
[0008]步骤3:通过文本相似性计算模块对用户对话内容形成的文本与预置意图文本进行匹配计算,将匹配结果与设定的匹配阈值(能否给出个具体值)比较;
[0009]如果匹配结果大于等于匹配阈值,则匹配成功,调用当前预置意图文本对应的意图处理模块对用户对话内容形成的文本进行意图处理,将结果反馈至语音合成与播报模块;
[0010]如果匹配结果小于匹配阈值,则匹配失败,则将用户对话内容形成的文本形式输入至大模型中进行识别,将结果反馈至语音合成与播报模块,所述大模型为深度学习技术构建的自然语言处理模型;
[0011]步骤4:所述语音合成与播报模块将接收到的信息通过TTS合成为语音信息,并进行播报。
[0012]优选的,所述语音识别模块识别用户对话内容,形成文本形式的具体方式如下:
[0013]步骤2

1:语音识别模块接收到语音输入,对语音信号进行预处理,去除语音中的噪声和杂音;
[0014]步骤2

2:将处理好的语音信号通过语音识别模块进行特征提取,提取出语音相关
特征;
[0015]步骤2

3:通过语音模型和声学模型对特征向量进行匹配和解码,获取用户对话内容文本。
[0016]优选的,所述语音识别模块为WeNet语音识别工具包。
[0017]优选的,所述文本相似性计算模块具体计算方式如下:
[0018]通过词袋模型将文本信息转换为以数值向量表示的文本向量,所述文本向量中包含文档中出现的所有单词的向量,每个维度表示一个单词,数值表示该单词在文档中的出现频率或权重;将文本向量通过相似度度量方法计算两个文本之间的相似性。
[0019]优选的,所述文本相似性计算模块具体计算方式如下:
[0020]通过词嵌入方法将文本信息转换为以数值向量表示的文本向量;
[0021]将文本中的单词映射到低维连续向量空间,通过学习单词的语义信息和上下文关系,使具有相似语义的单词在向量空间中距离较近;将文本中的所有单词的词嵌入向量求和或平均,得到表示整个文本的文本向量;通过比较向量之间的距离或相似度度量得到文本的相似性。
[0022]优选的,所述大模型为循环神经网络、长短期记忆网络或Transformer模型。
[0023]优选的,所述语音合成与播报模块通过damo/speech_sambert

hifigan_tts_zhiyan_emo_zh

cn_16k模块进行语音合成。
[0024]一种结合大模型的对话意图识别装置,包括处理器和存储有程序指令的存储器,所述处理器被配置为在运行所述程序指令时,执行所述的结合大模型的对话意图识别方法。
[0025]一种结合大模型的对话意图识别设备,包括:
[0026]设备本体;
[0027]所述的结合大模型的对话意图识别装置,被安装于所述设备本体。
[0028]一种存储介质,存储有程序指令,所述程序指令在运行时,执行所述的结合大模型的对话意图识别方法。
[0029]本专利技术的优点在于:本专利技术通过在对话流程中添加大模型,利用大模型的海量知识,对匹配失败的用户意图进行更好回答,提升对话系统的智能性以及用户体验感。
附图说明
[0030]附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。
[0031]图1为本专利技术实施例1的主视结构示意图。
具体实施方式
[0032]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0033]实施例1
[0034]一种结合大模型的对话意图识别方法,具体实施流程如下
[0035]步骤1:预置意图文本和对应的意图处理模块,所述预置意图处理模块包括系统意图和用户自定义意图,所述系统意图为通用意图,所述用户意图为用户自定义意图;
[0036]步骤2:通过语音识别模块识别用户对话内容,形成文本形式;所述语音识别模块为WeNet语音识别工具包。使用conformer网络结构和CTC/attention loss联合优化方法,利用帧级别的CTC loss和label级别attention

based auto

regression loss联合训练整个网络,具有较好端到端的流式识别效果。
[0037]所述语音识别模块识别用户对话内容,形成文本形式的具体方式如下:
[0038]步骤2

1:语音识别模块接收到语音输入,对语音信号进行预处理,去除语音中的噪声和杂音;
[0039]步骤2

2:将处理好的语音信号通过语音识别模块进行特征提取,提取出语音相关特征;
[0040]步骤2

3:通过语音模型和声学模型对特征向量进行匹配和解码,获取用户对话内容文本。
[0041]步骤3:通过文本相似性计算模块对用户对话内容形成的文本与预置意图文本进行匹配计算,将匹配结果与设定的匹配阈值比较;
[0042]所述文本相本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种结合大模型的对话意图识别方法,其特征在于,包括以下步骤:步骤1:预置意图文本和对应的意图处理模块,所述预置意图处理模块包括系统意图和用户自定义意图,所述系统意图为通用意图,所述用户意图为用户自定义意图;步骤2:通过语音识别模块识别用户对话内容,形成文本形式;步骤3:通过文本相似性计算模块对用户对话内容形成的文本与预置意图文本进行匹配计算,将匹配结果与设定的匹配阈值(能否给出个具体值)比较;如果匹配结果大于等于匹配阈值,则匹配成功,调用当前预置意图文本对应的意图处理模块对用户对话内容形成的文本进行意图处理,将结果反馈至语音合成与播报模块;如果匹配结果小于匹配阈值,则匹配失败,则将用户对话内容形成的文本形式输入至大模型中进行识别,将结果反馈至语音合成与播报模块,所述大模型为深度学习技术构建的自然语言处理模型;步骤4:所述语音合成与播报模块将接收到的信息通过TTS合成为语音信息,并进行播报。2.权利要求1所述的结合大模型的对话意图识别方法,其特征在于,所述语音识别模块识别用户对话内容,形成文本形式的具体方式如下:步骤2

1:语音识别模块接收到语音输入,对语音信号进行预处理,去除语音中的噪声和杂音;步骤2

2:将处理好的语音信号通过语音识别模块进行特征提取,提取出语音相关特征;步骤2

3:通过语音模型和声学模型对特征向量进行匹配和解码,获取用户对话内容文本。3.权利要求2所述的结合大模型的对话意图识别方法,其特征在于,所述语音识别模块为WeNet语音识别工具包。4.权利要求1所述的结合大模型的对话意图识别方法,其特征在于,所述文本相似性计算模块具体计算方式如下:通过词袋模型...

【专利技术属性】
技术研发人员:李志芸冯落落李晓瑜李沛张庆功尹青山
申请(专利权)人:山东新一代信息产业技术研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1