基于多模态交互的酒店智能语音对话方法技术

技术编号：46203490 阅读：11 留言：0更新日期：2025-08-26 19:10

本申请涉及信息交互技术领域。基于多模态交互的酒店智能语音对话方法，包括：获取用户在酒店语音对话中的多模态数据，其中，所述多模态数据包括语音数据、面部表情视频数据和文本交互数据；根据所述语音数据获取用户声学特征，并根据所述用户声学特征获取语音情感特征；根据所述面部表情视频数据获取用户视觉特征，并根据所述用户视觉特征获取视觉情感特征；根据所述文本交互数据获取用户文本特征，并根据所述用户文本特征获取文本情感特征。本发明专利技术通过融合语音、面部表情视频和文本交互数据，提升了用户情感状态与需求意图的识别精度，解决了传统单模态系统信息缺失导致的误判问题。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及信息交互，特别是涉及基于多模态交互的酒店智能语音对话方法。

技术介绍

1、随着智能语音交互技术的发展，酒店场景中的智能对话系统逐渐成为提升服务效率的重要手段。

2、现有技术存在以下不足：一是单模态数据无法处理多维度信息的关联分析，如语音内容与面部表情的矛盾情况易导致交互逻辑断层；并且反馈生成机制普遍缺乏情感适配性，传统系统多采用固定语气和单一反馈形式，未根据用户情感状态动态调整，交互体验生硬。

技术实现思路

1、本申请提供了基于多模态交互的酒店智能语音对话方法，以解决单模态数据无法处理多维度信息的关联分析，如语音内容与面部表情的矛盾情况易导致交互逻辑断层的问题。

2、第一方面，本申请提供了基于多模态交互的酒店智能语音对话方法，包括：

3、获取用户在酒店语音对话中的多模态数据，其中，所述多模态数据包括语音数据、面部表情视频数据和文本交互数据；

4、根据所述语音数据获取用户声学特征，并根据所述用户声学特征获取语音情感特征；

...

【技术保护点】

1.基于多模态交互的酒店智能语音对话方法，其特征在于，包括：

2.根据权利要求1所述的一种基于多模态交互的酒店智能语音对话方法，其特征在于，所述根据所述语音数据获取用户声学特征，并根据所述用户声学特征获取语音情感特征的步骤，包括：

3.根据权利要求1所述的一种基于多模态交互的酒店智能语音对话方法，其特征在于，所述根据所述面部表情视频数据获取用户视觉特征，并根据所述用户视觉特征获取视觉情感特征的步骤，包括：

4.根据权利要求1所述的一种基于多模态交互的酒店智能语音对话方法，其特征在于，所述根据所述文本交互数据获取用户文本特征，并根据所述用户文本特征获取文...

【技术特征摘要】

1.基于多模态交互的酒店智能语音对话方法，其特征在于，包括：

4.根据权利要求1所述的一种基于多模态交互的酒店智能语音对话方法，其特征在于，所述根据所述文本交互数据获取用户文本特征，并根据所述用户文本特征获取文本情感特征的步骤，包括：

5.根据权利要求1所述的一种基于多模态交互的酒店智能语音对话方法，其特征在于，所述将所述语音情感特征、视觉情感特征、文本情感特征进行融合...

【专利技术属性】
技术研发人员：孙楷龙，徐晓燕，孙一文，蔡志斌，张丹，
申请(专利权)人：杭州美宿在途网络科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人