【技术实现步骤摘要】
本申请涉及语音处理,应用于智能客服语音输出场景中,尤其涉及一种语音输出方法、装置、设备及其存储介质。
技术介绍
1、随着互联网的快速发展,传统的语音输出越来越趋向于智能语音输出方向发展,即采用智能语音客服方式替换人工客服与客户进行对话。
2、目前的智能语音客服主要应用在简单的业务咨询领域,例如,金融业务咨询领域,而且大部分的智能语音客服多为参照话术文本进行机械性的回答,未将情感类型引入到智能语音客服问答场景中;即使,存在将情感类型引入的方式,也仅仅只是通过语音情感识别技术对客户的情感状态进行分析和识别,从而更好地了解用户的需求和情况,未在交互过程中,将情感状态引入到智能语音客服的回答中,机械性的回答,容易造成用户反感,给客户带来极差的服务体验,无法营造出真实的语音咨询问答场景。
技术实现思路
1、本申请实施例的目的在于提出一种语音输出方法、装置、设备及其存储介质,以解决现有在智能语音客服应答场景中,未在交互过程中,将情感状态引入到智能语音客服的回答中,机械性的回答,容易造成用户
...【技术保护点】
1.一种语音输出方法,其特征在于,包括下述步骤:
2.根据权利要求1所述的语音输出方法,其特征在于,所述分别对所述第一语音片段、第二语音片段和第三语音片段进行预处理,获得预处理后的第一语音片段、第二语音片段和第三语音片段的步骤,具体包括:
3.根据权利要求2所述的语音输出方法,其特征在于,所述对当前待处理语音片段进行音频和文本分离处理,获得分离后成对的音频数据和文本数据的步骤,具体包括:
4.根据权利要求1所述的语音输出方法,其特征在于,所述多模态信息融合模型包括音频特征编码组件、文本特征编码组件、特征向量拼接融合组件和语音输出组件
...【技术特征摘要】
1.一种语音输出方法,其特征在于,包括下述步骤:
2.根据权利要求1所述的语音输出方法,其特征在于,所述分别对所述第一语音片段、第二语音片段和第三语音片段进行预处理,获得预处理后的第一语音片段、第二语音片段和第三语音片段的步骤,具体包括:
3.根据权利要求2所述的语音输出方法,其特征在于,所述对当前待处理语音片段进行音频和文本分离处理,获得分离后成对的音频数据和文本数据的步骤,具体包括:
4.根据权利要求1所述的语音输出方法,其特征在于,所述多模态信息融合模型包括音频特征编码组件、文本特征编码组件、特征向量拼接融合组件和语音输出组件,在执行所述将预处理后的第一语音片段、第二语音片段和第三语音片段输入到预设的多模态信息融合模型,根据所述多模态信息融合模型预测所述第三语音片段的输出情感类型的步骤之前,所述方法还包括:
5.根据权利要求4所述的语音输出方法,其特征在于,所述将预处理后的第一语音片段、第二语音片段和第三语音片段输入到预设...
【专利技术属性】
技术研发人员:张旭龙,王健宗,程宁,孙一夫,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。