模拟对话方法、装置、电子设备以及计算机可读存储介质制造方法及图纸

技术编号:36801683 阅读:10 留言:0更新日期:2023-03-08 23:48
本发明专利技术提供一种模拟对话方法、装置、电子设备以及计算机可读存储介质,涉及语音技术领域,所述方法包括:获取第一用户的语音信息,将所述语音信息转换为文本信息;获取目标音色以及所述文本信息对应的回复文本;基于所述回复文本和所述目标音色生成目标模拟语音;播放所述目标模拟语音,以使第二用户基于所述目标模拟语音与所述第一用户进行对话,以解决现有技术中由于变音设备的变音效果比较单一导致其应用场景比较受限以及适应性比较差的问题。应用场景比较受限以及适应性比较差的问题。应用场景比较受限以及适应性比较差的问题。

【技术实现步骤摘要】
模拟对话方法、装置、电子设备以及计算机可读存储介质


[0001]本专利技术涉及计算机
,尤其涉及一种模拟对话方法、装置、电子设备以及计算机可读存储介质。

技术介绍

[0002]现有技术中通过在电子设备中引入变音技术,以模拟用户与第三方进行对话,从而可以提高弱势群体的通话安全性以及居家安全性,例如,可以通过变音设备将独居女性或者独自在家的儿童的声音变换为成年男性的声音与第三方进行对话,以提高独居女性以及独自在家的儿童的居家安全性。
[0003]然而,由于这种变音设备的变音效果比较单一,例如,这种变音设备只能将用户的声音变换为固定的变音音色进行播放,从而导致变音设备的应用场景比较受限,并且存在适应性比较差的问题。

技术实现思路

[0004]本专利技术提供一种模拟对话方法、装置、电子设备以及计算机可读存储介质,用以解决现有技术中由于变音设备的变音效果比较单一导致其应用场景比较受限以及适应性比较差的问题。
[0005]本专利技术提供第一种模拟对话方法,包括:
[0006]获取第一用户的语音信息,将所述语音信息转换为文本信息;
[0007]获取目标音色以及所述文本信息对应的回复文本;
[0008]基于所述回复文本和所述目标音色生成目标模拟语音;
[0009]播放所述目标模拟语音,以使第二用户基于所述目标模拟语音与所述第一用户进行对话。
[0010]根据本专利技术提供的第一种模拟对话方法,获取所述文本信息对应的回复文本,包括:
[0011]提取所述文本信息中的第一关键词;
[0012]基于所述第一关键词,从预设对话数据库中确定与所述文本信息对应的回复文本,所述预设对话数据库中包括多条对话文本信息。
[0013]根据本专利技术提供的第一种模拟对话方法,所述将所述语音信息转换为文本信息之后,所述方法还包括:
[0014]将所述文本信息发送至所述第二用户对应的电子设备;
[0015]获取所述文本信息对应的回复文本,包括:
[0016]接收所述电子设备发送的所述文本信息对应的回复文本。
[0017]根据本专利技术提供的第一种模拟对话方法,所述获取目标音色,包括如下至少一项:
[0018]基于所述语音信息的音色信息,从音色数据库中确定所述目标音色;
[0019]基于所述文本信息中的第二关键词,从所述音色数据库中确定所述目标音色;
[0020]接收所述第二用户对应的电子设备发送的所述目标音色。
[0021]根据本专利技术提供的第一种模拟对话方法,所述方法还包括:
[0022]对所述语音信息进行异常检测,得到检测结果;
[0023]在所述检测结果为异常的情况下,生成呼叫提示信息;
[0024]将所述呼叫提示信息和所述语音信息发送至所述第二用户的紧急联系人,并将所述呼叫提示信息和所述语音信息上传至云服务器。
[0025]根据本专利技术提供的第一种模拟对话方法,所述方法还包括:
[0026]基于所述第二用户的录音信息生成第一声纹模型,并基于所述第一声纹模型获取所述第二用户对应的用户音色;
[0027]基于预设语音数据库生成多个第二声纹模型,并基于所述多个第二声纹模型获取多种模拟音色,所述预设语音数据库包括多类语音信息;
[0028]将所述用户音色以及多种模拟音色作为备选音色存储至所述音色数据库中,并将所述备选音色同步传输至所述第二用户对应的电子设备。
[0029]本专利技术还提供第二种模拟对话方法,包括:
[0030]接收模拟对话装置发送的文本信息,所述文本信息为基于第一用户的语音信息转换得到的;
[0031]获取第二用户从模式选择界面中选择的目标对话模式,所述模式选择界面中显示有多种对话模式;
[0032]基于所述目标对话模式和所述文本信息,获取所述文本信息对应的回复文本;
[0033]将所述回复文本发送至所述模拟对话装置,所述回复文本用于指示所述模拟对话装置基于所述回复文本以及获取到的目标音色生成目标模拟语音,以使第二用户基于所述目标模拟语音与所述第一用户进行对话。
[0034]根据本专利技术提供的第二种模拟对话方法,所述基于所述目标对话模式和所述文本信息,获取所述文本信息对应的回复文本,包括:
[0035]在所述目标对话模式为在线对话模式的情况下,获取所述第二用户编辑的回复文本;
[0036]在所述目标对话模式为模板对话模式的情况下,获取所述第二用户基于所述文本信息从对话模板显示界面中选择的回复文本,所述对话模板显示界面中显示有多条对话文本。
[0037]根据本专利技术提供的第二种模拟对话方法,所述方法还包括:
[0038]获取所述第二用户从音色显示界面中选择的目标音色,并将所述目标音色发送至所述模拟对话装置,所述音色显示界面中显示有多种备选音色,所述备选音色包括所述第二用户的用户音色以及多种模拟音色。
[0039]本专利技术还提供第一种模拟对话装置,包括:
[0040]语音识别模块,用于获取第一用户的语音信息,将所述语音信息转换为文本信息;
[0041]数据获取模块,用于获取目标音色以及所述文本信息对应的回复文本;
[0042]语音生成模块,用于基于所述回复文本和所述目标音色生成目标模拟语音;
[0043]模拟对话模块,用于播放所述目标模拟语音,以使第二用户基于所述目标模拟语音与所述第一用户进行对话。
[0044]本专利技术还提供第二种模拟对话装置,包括:
[0045]数据接收模块,用于接收模拟对话装置发送的文本信息,所述文本信息为基于第一用户的语音信息转换得到的;
[0046]模式选择模块,用于获取第二用户从模式选择界面中选择的目标对话模式,所述模式选择界面中显示有多种对话模式
[0047]文本获取模块,用于基于所述目标对话模式和所述文本信息,获取所述文本信息对应的回复文本;
[0048]文本发送模块,用于将所述回复文本发送至所述模拟对话装置,所述回复文本用于指示所述模拟对话装置基于所述回复文本以及获取到的目标音色生成目标模拟语音,以使第二用户基于所述目标模拟语音与所述第一用户进行对话。
[0049]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述第一种所述的模拟对话方法或者如上述第二种所述的模拟对话方法。
[0050]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一种所述的模拟对话方法或者如上述第二种所述的模拟对话方法。
[0051]本专利技术提供的模拟对话方法、装置、电子设备以及计算机可读存储介质,通过基于自由选择的目标音色以及回复文本以生成目标模拟语音,由于目标音色和回复文本的选择均不受限制,从而使得生成的目标模拟语音可以适用于各种应用场景的应用需求,从而便于本专利技术提供的模拟对话方法的大本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模拟对话方法,其特征在于,包括:获取第一用户的语音信息,将所述语音信息转换为文本信息;获取目标音色以及所述文本信息对应的回复文本;基于所述回复文本和所述目标音色生成目标模拟语音;播放所述目标模拟语音,以使第二用户基于所述目标模拟语音与所述第一用户进行对话。2.根据权利要求1所述的模拟对话方法,其特征在于,获取所述文本信息对应的回复文本,包括:提取所述文本信息中的第一关键词;基于所述第一关键词,从预设对话数据库中确定与所述文本信息对应的回复文本,所述预设对话数据库中包括多条对话文本信息。3.根据权利要求1所述的模拟对话方法,其特征在于,所述将所述语音信息转换为文本信息之后,所述方法还包括:将所述文本信息发送至所述第二用户对应的电子设备;获取所述文本信息对应的回复文本,包括:接收所述电子设备发送的所述文本信息对应的回复文本。4.根据权利要求1

3任一项所述的模拟对话方法,其特征在于,所述获取目标音色,包括如下至少一项:基于所述语音信息的音色信息,从音色数据库中确定所述目标音色;基于所述文本信息中的第二关键词,从所述音色数据库中确定所述目标音色;接收所述第二用户对应的电子设备发送的所述目标音色。5.根据权利要求1

3任一项所述的模拟对话方法,其特征在于,所述方法还包括:对所述语音信息进行异常检测,得到检测结果;在所述检测结果为异常的情况下,生成呼叫提示信息;将所述呼叫提示信息和所述语音信息发送至所述第二用户的紧急联系人,并将所述呼叫提示信息和所述语音信息上传至云服务器。6.根据权利要求4所述的模拟对话方法,其特征在于,所述方法还包括:基于所述第二用户的录音信息生成第一声纹模型,并基于所述第一声纹模型获取所述第二用户对应的用户音色;基于预设语音数据库生成多个第二声纹模型,并基于所述多个第二声纹模型获取多种模拟音色,所述预设语音数据库包括多类语音信息;将所述用户音色以及多种模拟音色作为备选音色存储至所述音色数据库中,并将所述备选音色同步传输至所述第二用户对应的电子设备。7.一种模拟对话方法,其特征在于,包括:接收模拟对话装置发送的文本信息,所述文本信息为基于第一用户的语音信息转换得到的;获取第二用户从模式选择界面中选择的目标对话模式,所述模式选择界面中显示有多种对话模式;基于所述目标对话模式和所述文本信息,获取所述文本信息对应的回复文本;
将所述回复文本发送...

【专利技术属性】
技术研发人员:赵雅男李良斌
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1