语音外呼方法、系统、设备及存储介质技术方案

技术编号:27752083 阅读:23 留言:0更新日期:2021-03-19 13:48
本发明专利技术提供了一种语音外呼的方法、系统、设备及存储介质,该方法包括:呼叫模块向客户进行语音外呼,成功后接收所述客户的语音回复,调用语音处理引擎根据语音回复生成机器回复,并将机器回复传输至客户。本发明专利技术实现了语音外呼机器与客户之间的交互,并对交互行为进行监控,同时提升了可以不基于特定场景的外呼标准化和通用性,有利于避免重复开发,充分利用机器资源。

【技术实现步骤摘要】
语音外呼方法、系统、设备及存储介质
本专利技术涉及语音外呼
,尤其涉及一种智能语音外呼方法、系统、设备及存储介质。
技术介绍
使用语音外呼系统生成自然语言代替工作人员进行呼叫可以不分时段,质量稳定且不会产生任何负面情绪,节省大量人力资源,对依赖语音播报的服务型企业有优势。目前应用中的语音外呼系统无法很好应对多个场景的外呼,缺乏通用的外呼系统架构,导致重复开发,没有充分利用机器资源,语音外呼状态也没有得到监控。
技术实现思路
针对现有技术中的问题,本专利技术的目的在于提供一种语音外呼方法系统、设备及存储介质,通过构建通用的外呼系统架构,避免重复开发,可以更好的应对不同场景,充分利用机器资源,同时对语音外呼状态进行有效监控。本专利技术实施例提供一种语音外呼方法,包括如下步骤:呼叫交换模块根据接到的订单的信息,向客户进行语音外呼并发出首句对话;所述呼叫交换模块在发出所述首句对话成功后,接收所述客户的语音回复,调用语音中控引擎;所述语音中控引擎调用语音处理引擎,根据所述语音回复生成机器回复;所述呼叫交换模块将所述机器回复传输至所述客户;其中,所述语音处理引擎包括自动语音识别引擎、口语理解引擎、对话管理引擎、自然语言生成引擎、语音合成引擎;所述语音中控引擎调用所述语音处理引擎,根据所述语音回复生成所述机器回复的步骤包括:所述自动语音识别引擎将所述语音回复转换成文本信息;所述口语理解引擎将所述文本信息转换为机器可以理解的语义解析;<br>所述对话管理引擎根据所述语义解析判断对话状态,并确定用以答复所述语义解析的所述机器回复;所述自然语言生成引擎将所述机器回复转换为自然语言文本;所述语音合成引擎将所述自然语言文本合成语音。可选的,本专利技术的语音外呼方法发出所述首句对话的步骤包括:所述呼叫交换模块向所述对话管理引擎发出请求,获取由所述对话管理引擎生成的所述首句对话,经语音合成后将所述首句对话发送至所述客户。可选的,本专利技术的语音外呼方法还包括如下步骤:监控服务模块对所述订单的语音外呼状态进行监控并作出处理。可选的,本专利技术的语音外呼方法中,所述监控服务模块对所述订单的语音外呼状态进行监控并作出处理的步骤包括:记录所述呼叫交换模块发出所述首句对话和所述机器回复的第一结果;记录所述对话管理引擎生成的所述首句对话和所述机器回复的第二结果;监控所述第一结果和所述第二结果的关联,若两者一致则将相应的所述订单标记为外呼成功,将所述第一结果和所述第二结果删除;若两者不一致的时长超过第一时间阈值,由所述监控服务模块发出报警。可选的,本专利技术的语音外呼方法中,所述调用语音中控引擎包括将所述客户的所述语音回复转化成计算机能处理的音频,通过MrcpServer将所述音频切割并由服务接口传输至所述语音中控引擎。可选的,本专利技术的语音外呼方法中,若所述MrcpServer检测到所述音频中静音的时长超过第二时间阈值,即判断所述客户处于静默状态,并调用所述对话管理引擎按照预先设计的对话策略主动向所述客户发出提示语。可选的,本专利技术的语音外呼方法中,所述语音合成引擎由所述语音中控引擎调用,返回所述音频到所述MrcpServer接口以及所述呼叫交换模块。可选的,本专利技术的语音外呼方法中,所述对话管理引擎由所述语音中控引擎直接调用,和/或由所述呼叫交换模块的话术中控调用以获取不同场景下的话术。可选的,本专利技术的语音外呼方法中,所述语音合成引擎将所述自然语言文本合成语音的步骤包括:所述语音合成引擎将录制好的目标音频语料以及所述自然语言文本输入声音特征提取模型和声学模型,输出与所述自然语言文本对齐的梅尔谱特征;将所述声学模型输出的所述梅尔谱特征输入声码器,合成对应的语音。本专利技术实施例还提供一种语音外呼系统,应用于以上任一项所述的语音外呼方法,所述系统包括:语音模块,所述语音模块包括语音中控引擎和语音处理引擎;所述语音处理引擎包括自动语音识别引擎、口语理解引擎、对话管理引擎、自然语言生成引擎、语音合成引擎;所述自动语音识别引擎将客户的语音回复转换成文本信息;所述口语理解引擎将所述文本信息转换为机器可以理解的语义解析;所述对话管理引擎根据所述语义解析判断对话状态,并确定用以答复所述语义解析的机器回复;所述自然语言生成引擎将所述机器回复转换为自然语言文本;所述语音合成引擎将所述自然语言文本合成语音;所述语音中控引擎用于调用所述语音处理引擎,根据所述客户的所述语音回复生成所述机器回复;呼叫交换模块,用于根据接到的订单的信息,向所述客户进行语音外呼并发出首句对话,在发出所述首句对话成功后,接收所述客户的所述语音回复,调用所述语音中控引擎,以及将所述语音中控引擎生成的所述机器回复传输至所述客户。可选的,本专利技术的语音外呼系统还包括监控服务模块,用于对所述订单的语音外呼状态进行监控并作出处理。本专利技术实施例还提供一种语音外呼设备,包括:处理器;存储器,其中存储有所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行所述的语音外呼方法的步骤。本专利技术实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被执行时实现所述的语音外呼方法的步骤。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开技术方案要求保护的范围。本专利技术的语音外呼方法、系统、设备及存储介质具有如下有益效果:本专利技术的语音克隆方法具备区分不同被模仿者的能力,仅需几分钟的音频学习即能模仿被模仿者的音色,并且处理大量数据时处理效率更高,训练次数相同时效果更好,减少了录制音频所花费的大量人力物力,合成的语音效果较好。附图说明通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显。图1是本专利技术一实施例的语音外呼方法的流程图;图2是本专利技术一实施例的语音外呼方法的架构图;图3是本专利技术一实施例的语音外呼方法的对话开始阶段的流程图;图4是本专利技术一实施例的语音外呼方法的正常对话进行阶段的流程图;图5是本专利技术一实施例的语音外呼方法的客户静音阶段的流程图;图6是本专利技术一实施例的语音外呼方法的监控服务的流程图;图7是本专利技术一实施例的语音外呼系统的架构图;图8是本专利技术一实施例的语音外呼设备的结构示意图;图9是本专利技术一实施例的计算机可读存储介质的结构示意图。具体实施方式现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在本文档来自技高网...

【技术保护点】
1.一种语音外呼方法,其特征在于,包括:/n呼叫交换模块根据接到的订单的信息,向客户进行语音外呼并发出首句对话;/n所述呼叫交换模块在发出所述首句对话成功后,接收所述客户的语音回复,调用语音中控引擎;/n所述语音中控引擎调用语音处理引擎,根据所述语音回复生成机器回复;/n所述呼叫交换模块将所述机器回复传输至所述客户;/n其中,所述语音处理引擎包括自动语音识别引擎、口语理解引擎、对话管理引擎、自然语言生成引擎、语音合成引擎;/n所述语音中控引擎调用所述语音处理引擎,根据所述语音回复生成所述机器回复的步骤包括:/n所述自动语音识别引擎将所述语音回复转换成文本信息;/n所述口语理解引擎将所述文本信息转换为机器可以理解的语义解析;/n所述对话管理引擎根据所述语义解析判断对话状态,并确定用以答复所述语义解析的所述机器回复;/n所述自然语言生成引擎将所述机器回复转换为自然语言文本;/n所述语音合成引擎将所述自然语言文本合成语音。/n

【技术特征摘要】
1.一种语音外呼方法,其特征在于,包括:
呼叫交换模块根据接到的订单的信息,向客户进行语音外呼并发出首句对话;
所述呼叫交换模块在发出所述首句对话成功后,接收所述客户的语音回复,调用语音中控引擎;
所述语音中控引擎调用语音处理引擎,根据所述语音回复生成机器回复;
所述呼叫交换模块将所述机器回复传输至所述客户;
其中,所述语音处理引擎包括自动语音识别引擎、口语理解引擎、对话管理引擎、自然语言生成引擎、语音合成引擎;
所述语音中控引擎调用所述语音处理引擎,根据所述语音回复生成所述机器回复的步骤包括:
所述自动语音识别引擎将所述语音回复转换成文本信息;
所述口语理解引擎将所述文本信息转换为机器可以理解的语义解析;
所述对话管理引擎根据所述语义解析判断对话状态,并确定用以答复所述语义解析的所述机器回复;
所述自然语言生成引擎将所述机器回复转换为自然语言文本;
所述语音合成引擎将所述自然语言文本合成语音。


2.根据权利要求1所述的语音外呼方法,其特征在于,所述发出首句对话的步骤包括:
所述呼叫交换模块向所述对话管理引擎发出请求,获取由所述对话管理引擎生成的所述首句对话,经语音合成后将所述首句对话发送至所述客户。


3.根据权利要求2所述的语音外呼方法,其特征在于,还包括如下步骤:
监控服务模块对所述订单的语音外呼状态进行监控并作出处理。


4.根据权利要求3所述的语音外呼方法,其特征在于,所述监控服务模块对所述订单的语音外呼状态进行监控并作出处理的步骤包括:
记录所述呼叫交换模块发出所述首句对话和所述机器回复的第一结果;
记录所述对话管理引擎生成的所述首句对话和所述机器回复的第二结果;
监控所述第一结果和所述第二结果的关联,若两者一致则将相应的所述订单标记为外呼成功,将所述第一结果和所述第二结果删除;若两者不一致的时长超过第一时间阈值,由所述监控服务模块发出报警。


5.根据权利要求1所述的语音外呼方法,其特征在于,所述调用语音中控引擎包括将所述客户的所述语音回复转化成计算机能处理的音频,通过MrcpServer将所述音频切割并由服务接口传输至所述语音中控引擎。


6.根据权利要求5所述的语音外呼方法,其特征在于,若所述MrcpServer检测到所述音频中静音的时长超过第二时间阈值,即判断所述客户处于静默状态,并调用所述对话管理引擎按照预先设计的对话策略主动向...

【专利技术属性】
技术研发人员:江小林罗超胡泓
申请(专利权)人:携程计算机技术上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1