基于多模态交互的酒店智能语音对话方法技术

技术编号:46203490 阅读:11 留言:0更新日期:2025-08-26 19:10
本申请涉及信息交互技术领域。基于多模态交互的酒店智能语音对话方法,包括:获取用户在酒店语音对话中的多模态数据,其中,所述多模态数据包括语音数据、面部表情视频数据和文本交互数据;根据所述语音数据获取用户声学特征,并根据所述用户声学特征获取语音情感特征;根据所述面部表情视频数据获取用户视觉特征,并根据所述用户视觉特征获取视觉情感特征;根据所述文本交互数据获取用户文本特征,并根据所述用户文本特征获取文本情感特征。本发明专利技术通过融合语音、面部表情视频和文本交互数据,提升了用户情感状态与需求意图的识别精度,解决了传统单模态系统信息缺失导致的误判问题。

【技术实现步骤摘要】

本申请涉及信息交互,特别是涉及基于多模态交互的酒店智能语音对话方法


技术介绍

1、随着智能语音交互技术的发展,酒店场景中的智能对话系统逐渐成为提升服务效率的重要手段。

2、现有技术存在以下不足:一是单模态数据无法处理多维度信息的关联分析,如语音内容与面部表情的矛盾情况易导致交互逻辑断层;并且反馈生成机制普遍缺乏情感适配性,传统系统多采用固定语气和单一反馈形式,未根据用户情感状态动态调整,交互体验生硬。


技术实现思路

1、本申请提供了基于多模态交互的酒店智能语音对话方法,以解决单模态数据无法处理多维度信息的关联分析,如语音内容与面部表情的矛盾情况易导致交互逻辑断层的问题。

2、第一方面,本申请提供了基于多模态交互的酒店智能语音对话方法,包括:

3、获取用户在酒店语音对话中的多模态数据,其中,所述多模态数据包括语音数据、面部表情视频数据和文本交互数据;

4、根据所述语音数据获取用户声学特征,并根据所述用户声学特征获取语音情感特征;

5、根据所述面部表情本文档来自技高网...

【技术保护点】

1.基于多模态交互的酒店智能语音对话方法,其特征在于,包括:

2.根据权利要求1所述的一种基于多模态交互的酒店智能语音对话方法,其特征在于,所述根据所述语音数据获取用户声学特征,并根据所述用户声学特征获取语音情感特征的步骤,包括:

3.根据权利要求1所述的一种基于多模态交互的酒店智能语音对话方法,其特征在于,所述根据所述面部表情视频数据获取用户视觉特征,并根据所述用户视觉特征获取视觉情感特征的步骤,包括:

4.根据权利要求1所述的一种基于多模态交互的酒店智能语音对话方法,其特征在于,所述根据所述文本交互数据获取用户文本特征,并根据所述用户文本特征获取文...

【技术特征摘要】

1.基于多模态交互的酒店智能语音对话方法,其特征在于,包括:

2.根据权利要求1所述的一种基于多模态交互的酒店智能语音对话方法,其特征在于,所述根据所述语音数据获取用户声学特征,并根据所述用户声学特征获取语音情感特征的步骤,包括:

3.根据权利要求1所述的一种基于多模态交互的酒店智能语音对话方法,其特征在于,所述根据所述面部表情视频数据获取用户视觉特征,并根据所述用户视觉特征获取视觉情感特征的步骤,包括:

4.根据权利要求1所述的一种基于多模态交互的酒店智能语音对话方法,其特征在于,所述根据所述文本交互数据获取用户文本特征,并根据所述用户文本特征获取文本情感特征的步骤,包括:

5.根据权利要求1所述的一种基于多模态交互的酒店智能语音对话方法,其特征在于,所述将所述语音情感特征、视觉情感特征、文本情感特征进行融合...

【专利技术属性】
技术研发人员:孙楷龙徐晓燕孙一文蔡志斌张丹
申请(专利权)人:杭州美宿在途网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1