多意图语音交互方法、存储介质及电子设备技术

技术编号:43207811 阅读:21 留言:0更新日期:2024-11-01 20:25
本申请提供一种多意图语音交互方法、存储介质及电子设备,涉及人机语音交互技术领域,该方法包括:获取待交互的人机对话结果,并解析人机对话结果所对应对话文本语段、提示音TTS链接和意图分句描述信息;根据提示音TTS链接、意图分句描述信息和对话文本语段,生成对应的音频播放请求队列;基于音频播放请求队列中的各个音频播放请求预置播放器组中相应播放器的音频资源播放参数;根据音频播放请求队列,顺序调用经预置的播放器响应执行相应的音频播放请求。由此,保证了意图提示音的连续性和一致性,实现无缝衔接的音频播放,有效提升了多意图人机语音交互过程的流畅度。

【技术实现步骤摘要】

本申请涉及人机语音交互,尤其涉及一种基于大语言模型的语音交互方法、存储介质及电子设备。


技术介绍

1、随着智能交互技术的大力推广,语音交互技术在各类终端设备中得到了越来越多的应用。大语言模型(large language model,llm)作为新兴技术与新型生产力,从pc端与移动设备端接入较多,应用于包括文本翻译、内容创作、问答搜索、虚拟助理和客户支持,以及办公、科研提效等场景。

2、随着人工智能技术的不断发展,大语言模型已能够较佳地与用户之间进行多意图语音交互,然而多个意图提示音之间的音频间隔过大,使得生成式播报间隔不流畅,导致用户听感生硬,降低了系统的多意图语音交互体验。

3、针对上述问题,目前业界暂未提出较佳的解决方案。


技术实现思路

1、本申请提供一种多意图语音交互方法、存储介质及电子设备,用以至少解决目前相关技术中多意图语音播报间隔不流畅而导致听感生硬的问题。

2、第一方面,本申请实施例提供一种多意图语音交互方法,包括:获取待交互的人机对话结果,并解析所述人机对本文档来自技高网...

【技术保护点】

1.一种多意图语音交互方法,包括:

2.根据权利要求1所述的方法,其中,所述解析所述人机对话结果所对应对话文本语段、提示音TTS链接和意图分句描述信息,包括:

3.根据权利要求1所述的方法,其中,所述根据所述提示音TTS链接、所述意图分句描述信息和所述对话文本语段,生成对应的音频播放请求队列,包括:

4.根据权利要求1所述的方法,其中,所述基于所述音频播放请求队列中的各个音频播放请求预置播放器组中相应播放器的音频资源播放参数,包括:

5.根据权利要求4所述的方法,其中,所述根据所述音频播放请求队列,顺序调用经预置的播放器响应执行相应的音频播...

【技术特征摘要】

1.一种多意图语音交互方法,包括:

2.根据权利要求1所述的方法,其中,所述解析所述人机对话结果所对应对话文本语段、提示音tts链接和意图分句描述信息,包括:

3.根据权利要求1所述的方法,其中,所述根据所述提示音tts链接、所述意图分句描述信息和所述对话文本语段,生成对应的音频播放请求队列,包括:

4.根据权利要求1所述的方法,其中,所述基于所述音频播放请求队列中的各个音频播放请求预置播放器组中相应播放器的音频资源播放参数,包括:

5.根据权利要求4所述的方法,其中,所述根据所述音频播放请求队列,顺序调用经预置的播放器响应执行相应的音频播放请求,包括:

6.根据权利要求5所述的方法,其中,在生成第一播放器结束事件之前,所...

【专利技术属性】
技术研发人员:张恒云先甫杨才君
申请(专利权)人:思必驰科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1