一种语音对话方法、装置及电子设备制造方法及图纸

技术编号:45038566 阅读:25 留言:0更新日期:2025-04-18 17:21
本发明专利技术公开了一种语音对话方法、装置及电子设备,包括接收用户的语音输入并转换成输入文本;从内部知识库检索出与用户查询相关的文本片段,并检索出的文本片段和输入文本共同提供给大规模语言模型;根据检索出的文本片段和用户的输入文本数据生成高度相关的自然语言回答;通过自然语言处理技术分析用户的输入文本的情感,并为大规模语言模型生成的回答匹配相应的语音情绪;将大规模语言模型生成的文本回答转换成匹配情感的语音输出,供用户收听,利用RAG检索增强生成知识库技术与情感识别技术相结合,提供更准确且富有情感的语音对话解决方案。

【技术实现步骤摘要】

本专利技术属于属于人机交互领域,特别涉及一种语音对话方法、装置及电子设备


技术介绍

1、在语音对话助手领域,现有技术主要依赖于两种方式:基于预定义规则的固定回答模式或基于预训练语言模型的生成回答。

2、1.固定回答模式:这种方法基于预设的关键词和规则,针对不同的问题触发固定的回答。虽然这种方式在简单场景中较为有效,但在应对复杂、开放性问题时会显得僵化,难以满足用户多样化的需求。同时,由于固定规则难以覆盖所有情况,无法处理超出规则的未知问题。

3、2.预训练语言模型:这类技术依赖大型预训练模型,如chatgpt,生成与用户输入语境相关的回答。然而,这些模型并不依赖特定领域的知识库,导致其在特定领域的准确性有限,特别是对于公司内部的语音助手来说,它们往往不能提供基于内部知识库的专业解答。此外,这类模型缺乏情感识别和匹配功能,导致生成的回答与用户输入的情绪不匹配,影响用户体验。

4、以上现有技术在回答灵活性、准确性以及情感化互动方面存在不足之处,因此提出本申请。


技术实现思路</b>

本文档来自技高网...

【技术保护点】

1.一种语音对话方法,其特征在于,包括:

2.根据权利要求1所述的一种语音对话方法,其特征在于,从内部知识库检索出与用户查询相关的文本片段包括:

3.根据权利要求2所述的一种语音对话方法,其特征在于,对问题进行向量化表示包括:

4.根据权利要求2所述的一种语音对话方法,其特征在于,根据输出的文本回答和用户的输入文本数据生成高度相关的自然语言回答包括:

5.根据权利要求4所述的一种语音对话方法,其特征在于,

6.根据权利要求4所述的一种语音对话方法,其特征在于,所述大规模语言模型模块包含有VLLM推理框架,利用VLLM推理框架对问...

【技术特征摘要】

1.一种语音对话方法,其特征在于,包括:

2.根据权利要求1所述的一种语音对话方法,其特征在于,从内部知识库检索出与用户查询相关的文本片段包括:

3.根据权利要求2所述的一种语音对话方法,其特征在于,对问题进行向量化表示包括:

4.根据权利要求2所述的一种语音对话方法,其特征在于,根据输出的文本回答和用户的输入文本数据生成高度相关的自然语言回答包括:

5.根据权利要求4所述的一种语音对话方法,其特征在于,

6.根据权利要求4所述的一种语音对话方法,其特征在于,所述大规模语言模型模块包含有v...

【专利技术属性】
技术研发人员:林嘉华姜东晓
申请(专利权)人:上海捷晓信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1