一种语音对话方法、装置及电子设备制造方法及图纸

技术编号：45038566 阅读：25 留言：0更新日期：2025-04-18 17:21

本发明专利技术公开了一种语音对话方法、装置及电子设备，包括接收用户的语音输入并转换成输入文本；从内部知识库检索出与用户查询相关的文本片段，并检索出的文本片段和输入文本共同提供给大规模语言模型；根据检索出的文本片段和用户的输入文本数据生成高度相关的自然语言回答；通过自然语言处理技术分析用户的输入文本的情感，并为大规模语言模型生成的回答匹配相应的语音情绪；将大规模语言模型生成的文本回答转换成匹配情感的语音输出，供用户收听，利用RAG检索增强生成知识库技术与情感识别技术相结合，提供更准确且富有情感的语音对话解决方案。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于属于人机交互领域，特别涉及一种语音对话方法、装置及电子设备。

技术介绍

1、在语音对话助手领域，现有技术主要依赖于两种方式：基于预定义规则的固定回答模式或基于预训练语言模型的生成回答。

2、1.固定回答模式：这种方法基于预设的关键词和规则，针对不同的问题触发固定的回答。虽然这种方式在简单场景中较为有效，但在应对复杂、开放性问题时会显得僵化，难以满足用户多样化的需求。同时，由于固定规则难以覆盖所有情况，无法处理超出规则的未知问题。

3、2.预训练语言模型：这类技术依赖大型预训练模型，如chatgpt，生成与用户输入语境相关的回答。然而，这些模型并不依赖特定领域的知识库，导致其在特定领域的准确性有限，特别是对于公司内部的语音助手来说，它们往往不能提供基于内部知识库的专业解答。此外，这类模型缺乏情感识别和匹配功能，导致生成的回答与用户输入的情绪不匹配，影响用户体验。

4、以上现有技术在回答灵活性、准确性以及情感化互动方面存在不足之处，因此提出本申请。

技术实现思路</b>

本文档来自技高网...

【技术保护点】

1.一种语音对话方法，其特征在于，包括：
2.根据权利要求1所述的一种语音对话方法，其特征在于，从内部知识库检索出与用户查询相关的文本片段包括：
3.根据权利要求2所述的一种语音对话方法，其特征在于，对问题进行向量化表示包括：
4.根据权利要求2所述的一种语音对话方法，其特征在于，根据输出的文本回答和用户的输入文本数据生成高度相关的自然语言回答包括：
5.根据权利要求4所述的一种语音对话方法，其特征在于，
6.根据权利要求4所述的一种语音对话方法，其特征在于，所述大规模语言模型模块包含有VLLM推理框架，利用VLLM推理框架对问...

【技术特征摘要】

1.一种语音对话方法，其特征在于，包括：
2.根据权利要求1所述的一种语音对话方法，其特征在于，从内部知识库检索出与用户查询相关的文本片段包括：
3.根据权利要求2所述的一种语音对话方法，其特征在于，对问题进行向量化表示包括：
4.根据权利要求2所述的一种语音对话方法，其特征在于，根据输出的文本回答和用户的输入文本数据生成高度相关的自然语言回答包括：
5.根据权利要求4所述的一种语音对话方法，其特征在于，
6.根据权利要求4所述的一种语音对话方法，其特征在于，所述大规模语言模型模块包含有v...

【专利技术属性】
技术研发人员：林嘉华，姜东晓，
申请(专利权)人：上海捷晓信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人

上一篇：自动驾驶性能信息获取方法、装置以及计算机存储介质制造方法及图纸
下一篇：目标点位置确定方法、设备、存储介质及系统技术方案

相关技术

一种跨境物流尾程服务商分单系统及方法...

一种代码质量管理方法及系统技术方案

基于神经网络和强化学习的物流决策方法...

一种稳定扩散模型的提示词生成方法、装...

一种基于语音处理与大语言模型的多语言...

一种海外多国地址解析方法及电子设备技...

一种基于Redis的亿级单号去重的方...

一种基于RocketMQ实名制数据推...

一种订单自动学习调度的方法、系统和设...

一种订单筛单拦截的方法、系统和设备技...

网友询问留言已有0条评论

还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1

发布您的意见

相关领域技术

音频处理方法、装置、电子设备和存储介...

超低功耗端侧AI芯片的多通道音频处理...

基于语义分析的出行应急状态判断方法、...

一种语音识别方法、装置、存储介质及设...

基于多模态联合学习的多任务语音识别与...

一种音频煤矸识别方法技术

拼音播报方法、装置、电子设备及存储介...

一种基于生产过程控制的噪声达标方法技...