语音交互方法、服务器和计算机可读存储介质技术

技术编号:45839233 阅读:8 留言:0更新日期:2025-07-15 22:46
本申请公开了一种语音交互方法、服务器和计算机可读存储介质。方法包括:根据获取到的当前语音请求和与当前语音请求相关联的目标图像,确定融合特征信息。接着,基于预设大语言模型,根据融合特征信息,进行语音交互。如此,通过融合当前语音请求和目标图像,能够准确地理解用户的意图,减少误触现象,提高语音交互的准确性和流畅性,从而增强用户体验。

【技术实现步骤摘要】

本申请涉及语音交互领域,特别涉及一种语音交互方法、服务器和计算机可读存储介质


技术介绍

1、相关技术中,车载智能助手能够通过获取用户语音请求来进行语音交互,从而方便用户对车辆进行控制。然而,仅仅依赖于语音请求单一模态的信息,车载智能助手可能无法准确识别当前语音请求是否由用户发出,从而导致误触现象,影响用户体验。


技术实现思路

1、本申请提供了一种语音交互方法、服务器和计算机可读存储介质。

2、本申请实施方式提供一种语音交互方法,所述方法包括:

3、根据获取到的当前语音请求和与所述当前语音请求相关联的目标图像,确定融合特征信息;

4、基于预设大语言模型,根据所述融合特征信息,进行所述语音交互。

5、如此,服务器根据获取到的当前语音请求和与当前语音请求相关联的目标图像,确定融合特征信息。接着,基于预设大语言模型,服务器根据融合特征信息,进行语音交互。这样,通过融合当前语音请求和目标图像,能够准确地理解用户的意图,减少误触现象,提高语音交互的准确性和流畅性,从而增强本文档来自技高网...

【技术保护点】

1.一种语音交互方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述当前语音请求的时间戳信息,自所述车辆座舱的视频流信息中,确定所述目标图像,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据获取到的当前语音请求和与所述当前语音请求相关联的目标图像,确定融合特征信息,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述音频特征信息和所述图像特征信息,确定所述融合特征信息,包括:

6.根据权利要求1所述的方法,其特征在...

【技术特征摘要】

1.一种语音交互方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述当前语音请求的时间戳信息,自所述车辆座舱的视频流信息中,确定所述目标图像,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据获取到的当前语音请求和与所述当前语音请求相关联的目标图像,确定融合特征信息,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述音频特征信息和所述图像特征信息,确定所述融合特征信息,包括:

6.根据权利要求1所述的方法,其特征在于,所述基于预设大语言模...

【专利技术属性】
技术研发人员:王小平汪建支淑婷李晓辰孟菲
申请(专利权)人:广州小鹏汽车科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1