一种语音输出方法、装置、设备及其存储介质制造方法及图纸

技术编号:43808839 阅读:21 留言:0更新日期:2024-12-27 13:25
本申请实施例属于语音处理技术领域,应用于智能客服语音输出场景中,涉及一种语音输出方法、装置、设备及其存储介质,通过获取一问一答对话形式的语音片段;进行预处理,获得预处理后的语音片段;将预处理后的语音片段输入到多模态信息融合模型,预测目标语音片段的输出情感类型;控制当前发音对象以输出情感类型输出目标语音片段。将所述语音输出方法应用到智能语音客服应答场景中,使得智能语音客服充分考虑到上下文信息,从音频数据和文本数据中获取情感信息,使得输出的语音片段情感更加丰富,更加贴合实际的语音咨询问答场景,同时,在智能语音客服对话上,引入了情感类型,避免输出的智能语音太过机械化,提升客户的对话体验。

【技术实现步骤摘要】

本申请涉及语音处理,应用于智能客服语音输出场景中,尤其涉及一种语音输出方法、装置、设备及其存储介质


技术介绍

1、随着互联网的快速发展,传统的语音输出越来越趋向于智能语音输出方向发展,即采用智能语音客服方式替换人工客服与客户进行对话。

2、目前的智能语音客服主要应用在简单的业务咨询领域,例如,金融业务咨询领域,而且大部分的智能语音客服多为参照话术文本进行机械性的回答,未将情感类型引入到智能语音客服问答场景中;即使,存在将情感类型引入的方式,也仅仅只是通过语音情感识别技术对客户的情感状态进行分析和识别,从而更好地了解用户的需求和情况,未在交互过程中,将情感状态引入到智能语音客服的回答中,机械性的回答,容易造成用户反感,给客户带来极差的服务体验,无法营造出真实的语音咨询问答场景。


技术实现思路

1、本申请实施例的目的在于提出一种语音输出方法、装置、设备及其存储介质,以解决现有在智能语音客服应答场景中,未在交互过程中,将情感状态引入到智能语音客服的回答中,机械性的回答,容易造成用户反感,给客户带来极差本文档来自技高网...

【技术保护点】

1.一种语音输出方法,其特征在于,包括下述步骤:

2.根据权利要求1所述的语音输出方法,其特征在于,所述分别对所述第一语音片段、第二语音片段和第三语音片段进行预处理,获得预处理后的第一语音片段、第二语音片段和第三语音片段的步骤,具体包括:

3.根据权利要求2所述的语音输出方法,其特征在于,所述对当前待处理语音片段进行音频和文本分离处理,获得分离后成对的音频数据和文本数据的步骤,具体包括:

4.根据权利要求1所述的语音输出方法,其特征在于,所述多模态信息融合模型包括音频特征编码组件、文本特征编码组件、特征向量拼接融合组件和语音输出组件,在执行所述将预处理...

【技术特征摘要】

1.一种语音输出方法,其特征在于,包括下述步骤:

2.根据权利要求1所述的语音输出方法,其特征在于,所述分别对所述第一语音片段、第二语音片段和第三语音片段进行预处理,获得预处理后的第一语音片段、第二语音片段和第三语音片段的步骤,具体包括:

3.根据权利要求2所述的语音输出方法,其特征在于,所述对当前待处理语音片段进行音频和文本分离处理,获得分离后成对的音频数据和文本数据的步骤,具体包括:

4.根据权利要求1所述的语音输出方法,其特征在于,所述多模态信息融合模型包括音频特征编码组件、文本特征编码组件、特征向量拼接融合组件和语音输出组件,在执行所述将预处理后的第一语音片段、第二语音片段和第三语音片段输入到预设的多模态信息融合模型,根据所述多模态信息融合模型预测所述第三语音片段的输出情感类型的步骤之前,所述方法还包括:

5.根据权利要求4所述的语音输出方法,其特征在于,所述将预处理后的第一语音片段、第二语音片段和第三语音片段输入到预设...

【专利技术属性】
技术研发人员:张旭龙王健宗程宁孙一夫
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1