语音交互方法、装置、电子设备和存储介质制造方法及图纸

技术编号:27405370 阅读:21 留言:0更新日期:2021-02-21 14:18
本申请公开了语音交互方法、装置、电子设备和存储介质,涉及自然语言处理、语音技术和深度学习领域。具体实现方案为:获取用户语音,根据对用户语音识别得到的交互上文,从语料库中确定用于回复交互上文的交互下文,获取交互下文对应的情感类型,根据情感类型和设定音色,对交互下文进行语音合成,以得到回复语音,采用回复语音进行语音交互。本申请中在对交互下文进行语音合成时,将情感和设定音色融入交互下文,获取了情感丰富的特定音色的回复语音,提高了语音交互的效果和个性化需求。提高了语音交互的效果和个性化需求。提高了语音交互的效果和个性化需求。

【技术实现步骤摘要】
语音交互方法、装置、电子设备和存储介质


[0001]本申请涉及计算机
,具体涉及自然语言处理、语音技术和深度学习领域,尤其是涉及语音交互方法、装置、电子设备和存储介质。

技术介绍

[0002]随着语音交互被越来越多用户所接受,智能助手在用户日常生活中扮演陪伴的角色越来越重要。在语音交互的过程中,基于语音合成技术将文字信息转换为可理解的、高拟人化的交互语音。
[0003]虽然人工智能的不断迅速发展,自然语言交互的效率和精准度、智能性也在不断前进,但现有的产品的对话依旧固定机械化,缺少情感,只能按照预置的固定策略来回答用户,不能满足用户对人机交互的个性化需求,语音交互效果较差。

技术实现思路

[0004]本申请提供了一种用于将情感和音色进行语音合成,以实现个性化语音生成,以提高交互效果的语音交互方法、装置、电子设备和存储介质。
[0005]根据本申请的一方面,提供了一种语音交互方法,包括:
[0006]获取用户语音;
[0007]根据对用户语音识别得到的交互上文,从语料库中确定用于回复所述交互上文的交互下文;
[0008]获取所述交互下文对应的情感类型;
[0009]根据所述情感类型和设定音色,对所述交互下文进行语音合成,以得到回复语音;
[0010]采用所述回复语音进行语音交互。
[0011]根据本申请的另一方面,提供了一种语音交互装置,包括:
[0012]第一获取模块,用于获取用户语音;
[0013]确定模块,用于根据对用户语音识别得到的交互上文,从语料库中确定用于回复所述交互上文的交互下文;
[0014]第二获取模块,用于获取所述交互下文对应的情感类型;
[0015]合成模块,用于根据所述情感类型和设定音色,对所述交互下文进行语音合成,以得到回复语音;
[0016]交互模块,用于采用所述回复语音进行语音交互。
[0017]根据本申请的另一方面,提供了一种电子设备,包括:
[0018]至少一个处理器;以及
[0019]与所述至少一个处理器通信连接的存储器;其中,
[0020]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面所述的语音交互方法。
[0021]根据本申请的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储
介质,所述计算机指令用于使所述计算机执行第一方面所述的语音交互方法。
[0022]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0023]附图用于更好地理解本方案,不构成对本申请的限定。其中:
[0024]图1为本申请实施例所提供的一种语音交互方法的流程示意图;
[0025]图2为本申请实施例所提供的另一种语音交互方法的流程示意图;
[0026]图3为本申请实施例的语音交互模型的结构示意图;
[0027]图4为本申请实施例提供的语音交互模型的训练示意图;
[0028]图5为本申请实施例提供的一种语音交互装置的结构示意图;
[0029]图6是用来实现本申请实施例的语音交互方法的电子设备的框图。
具体实施方式
[0030]以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0031]下面参考附图描述本申请实施例的语音交互方法、装置、电子设备和存储介质。
[0032]图1为本申请实施例所提供的一种语音交互方法的流程示意图。
[0033]如图1所示,该方法包括以下步骤:
[0034]步骤101,获取用户语音。
[0035]本实施例的执行主体为语音交互装置,该装置可设置于电子设备中,电子设备可以为语音交互助手,例如,智能机器人,本实施例中不进行限定。
[0036]在本申请的一个实施例中,用户语音可以是电子设备通过拾音器采集到用户实时输入的语音,进而对语音进行分析和合成,以得到用户语音。
[0037]在本申请的另一个实施例中,可以是外部设备采集到用户语音后通过网络发送至电子设备的语音等。在一个实施例中,为了减少语音交互对电子设备的损耗,本申请实施例的执行主体还可以是云端服务器,也就是说,电子设备接收用户输入的语音信息,并将语音信息发送至云端服务器,云端服务器可根据获取到的语音信息生成用户语音,并将用户语音返回给电子设备。其中,电子设备为具有语音功能的终端设备。
[0038]步骤102,根据对用户语音识别得到的交互上文,从语料库中确定用于回复交互上文的交互下文。
[0039]本实施例的一个示例中,可根据语音识别模型,对用户语音进行识别,以识别得到用户语音得到交互上文,例如,识别得到的交互上文为:我不小心把花瓶打碎了,怎么办啊?进而,根据识别得到的交互上文,从语料库中确定用于回复交互上文的交互下文,例如,确定的交互下文为:没事的,宝宝,小心不要划破手指。
[0040]作为一种可能的实现方式,可根据交互上文,利用距离算法,例如,欧式距离,从语料库中匹配得到回复交互上文的交互下文。
[0041]步骤103,获取交互下文对应的情感类型。
[0042]在本申请实施例的一种可能的实现方式中,对交互下文进行分析,确定交互下文中是否包含指示情感的情感关键字,根据情感关键词确定情感类型。其中,情感关键词可以是预设存储于关键词数据库内,将交互下文对应的文本进行词语划分后,可以在关键词数据库中进行查找,如果查找到,则根据查找到的情感关键字对应的情感类型,确定交互下文对应的情感类型。
[0043]在本申请实施例的另一种可能的实现方式中,采用预先训练得到的情感分类模型进行识别,该情感分类模型可以是基于自然语言处理模型(Bidirectional Encoder Representations from Transformers,BERT)或者百度ERNIE模型(Enhanced Language Representation with Informative Entities,ERNIE),具体来说,将交互下文输入训练得到的情感分类模型,输出和交互下文对应的情感标签,例如,交互下文为“今天处女座的运势相当好”,则确定的情感标签为“开心”;交互下文为“今天上证指数2879点,跌幅8%”,则确定的情感标签为“难过”,此外,情感标签还可以为:平静、激动等,本实施例中不一一列举。进而,根据情感标签,确定情感类型,例如,情感标签为难过,则确定情感类型为伤心消极类型,提高了交互下文情感类型确定的准本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音交互方法,包括:获取用户语音;根据对用户语音识别得到的交互上文,从语料库中确定用于回复所述交互上文的交互下文;获取所述交互下文对应的情感类型;根据所述情感类型和设定音色,对所述交互下文进行语音合成,以得到回复语音;采用所述回复语音进行语音交互。2.根据权利要求1所述的语音交互方法,其中,所述根据所述情感类型,和设定音色,对所述交互下文进行语音合成,以得到回复语音,包括:将所述情感类型对应语音的第一梅尔谱mel特征和所述设定音色对应语音的第二梅尔谱mel特征、以及所述交互下文输入经过训练的语音合成模型,以得到所述回复语音。3.根据权利要求2所述的语音交互方法,其中,所述语音合成模型,包括:风格编码器,用于输入所述第一mel特征以得到风格编码;音色编码器,用于输入所述第二mel特征以得到音色编码;文本编码器,用于输入所述交互下文以得到文本编码;解码器,用于输入所述文本编码、所述风格编码和所述音色编码以得到目标mel特征;声码器,用于输入所述目标mel特征以得到所述回复语音。4.根据权利要求2所述的语音交互方法,其中,所述语音合成模型分别采用第一训练样本和第二训练样本训练得到;其中,所述第一训练样本,用于对所述语音合成模型进行第一阶段训练;所述第一训练样本包括采用至少一种音色录制的多种情感类型的第一语音,以及所述第一语音对应的文本;所述第二训练样本,用于对所述语音合成模型进行第二阶段训练;所述第二训练样本包括采用所述设定音色录制的第二语音,以及所述第二语音对应的文本和情感类型。5.根据权利要求1-4任一项所述的方法,其中,所述获取所述交互下文对应的情感类型,包括:查询所述交互下文对应的情感标签;其中,所述情感标签是采用情感分类模型对所述交互下文进行分类得到的;根据所述情感标签,确定所述情感类型。6.一种语音交互装置,包括:第一获取模块,用于获取用户语音;确定模块,用于根据对用户语音识别得到的交互上文,从语料库中确定用于回复所述交互上文的交互下文;第二获取模块,用于获取所述交互下文对应的情...

【专利技术属性】
技术研发人员:李循袁俊
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1