一种外呼播报方法、装置、存储介质及电子设备制造方法及图纸

技术编号：37126905 阅读：22 留言：0更新日期：2023-04-06 21:25

本申请公开了一种外呼播报方法、装置、存储介质及电子设备，其中方法包括：获取被播报对象的身份信息，并确定待播报的目标录音文件；基于所述目标录音文件的目标音色确定与目标音色对应的目标音色克隆模型；基于所述目标音色克隆模型对所述身份信息进行转换，获得包含身份信息的、具有所述目标音色的第一音频文件；基于所述第一音频文件以及所述目标录音文件生成目标音频文件；基于所述目标音频文件对所述被播报对象进行外呼播报。本申请中的方法通过获得包含与场景对应的话术内容又包含用户身份信息、且具有真人音色的音频文件，能为后续基于该目标音频文件进行语音播报提供保障，提升了用户对播报语音的亲和力，进而提升了用户的信任度。了用户的信任度。了用户的信任度。

全部详细技术资料下载

【技术实现步骤摘要】
一种外呼播报方法、装置、存储介质及电子设备

[0001]本专利技术涉及客服外呼
，特别涉及一种外呼播报方法、装置、存储介质及电子设备。

技术介绍

[0002]目前，随着呼叫中心的发展，外呼服务已被广泛应用在各种领域，常见的例如金融行业、保险行业、医疗行业以及电销行业等。
[0003]在各领域中，例如在保险、电销领域，用户对于外呼来电的信任度较低，如果能够准确叫出用户的名字将有助于提升用户的信任度。
[0004]目前外呼机器人通常是基于语音合成技术，合成包含用户姓名和销售话术的话术文本，然后将该话术文本发送给语音合成系统合成相应的语音。但是完全基于语音合成技术合成的语音与真人声音具有一定差距，无法很好地适应真实销售场景，进而导致外呼时用户对外呼播报信任度较低。
[0005]如果挑选优秀的坐席人员录制固定话术录音，控制外呼机器人播报真人录制的话术录音，这种方案的虽然播报的声音较为自然、具有亲和力，贴近真实销售场景。但是无法录制大量包含不同的用户姓名的话术录音，进而导致外呼时用户对外呼播报信任度较低。
[0006本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种外呼播报方法，其特征在于，获取被播报对象的身份信息，并确定待播报的目标录音文件；基于所述目标录音文件的目标音色确定与目标音色对应的目标音色克隆模型；基于所述目标音色克隆模型对所述身份信息进行转换，获得包含身份信息的、具有所述目标音色的第一音频文件；基于所述第一音频文件以及所述目标录音文件生成目标音频文件；基于所述目标音频文件对所述被播报对象进行外呼播报。2.如权利要求1所述的方法，其特征在于，在确定待播报的目标录音文件之前，所述方法还包括训练获得与各音色对应的音色克隆文件，包括：基于各样本文本信息，以及与各样本文本信息对应的、具有第一音色的样本录音文件，对对应的初始音色克隆模型中的初始声学模型以及初始声码器进行模型训练，获得与各第一音色对应的第一音色克隆模型；各所述第一音色克隆模型中包含第一声学模型以及第一声码器。3.如权利要求2所述的方法，其特征在于，在训练获得各第一音色克隆模型之后，所述方法还包括：建立各所述第一音色克隆模型与第一音色的对应关系；所述基于所述目标录音文件的目标音色确定目标声学模型，具体包括：基于所述目标音色查找所述映射关系，以获得与所述目标音色对应的目标音色克隆模型。4.如权利要求1所述的方法，其特征在于，所述确定待播报的目标录音文件，具体包括：基于话术场景从话术录音库中筛选与所述话术场景对应的目标录音文件。5.如权利要求1所述的方法，其特征在于，所述基于所述目标音色克隆模型对所述身份信息进行转换，获得包含身份信息的、具有所述目标音色的第一音频文件，具体包括：对所述身份信息进行转换，获得与身份信息对应的文本特征向量；基于所述目标音色克隆模型中的目标声学模型，将所述文本特征向量转换成声学特征；基于所述目标音色模...

【专利技术属性】
技术研发人员：范野，郭立钊，辛逸男，黄明星，王福钋，张航飞，徐华韫，曹富康，沈鹏，
申请(专利权)人：北京水滴科技集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人