外呼系统的语音合成方法、平台、服务器以及介质技术方案

技术编号:26306097 阅读:40 留言:0更新日期:2020-11-10 20:04
本申请提供了一种外呼系统的语音合成方法、平台、服务器以及介质,方法包括:互动式语音应答模块接收待合成文字段,将待合成文字段发送至中间件;中间件将待合成文字段切分成第一数量的单位文字段,并将第一数量的单位文字段发送至语音合成服务器,使得语音合成服务器基于各单位文字段在待合成文字段中的位置顺序,将第一数量的单位文字段合并成第二数量的子文字段;互动式语音应答模块基于各语音文件被合成的时间顺序,依次播放被语音合成服务器合成的各语音文件。该方法能够在有限语音合成能力并发通路的前提下,能够尽可能的满足高并发通话时的语音合成较低延时的需求,更大能力的发挥语音合成的能力效果,显著地提升了客户的使用体验。

【技术实现步骤摘要】
外呼系统的语音合成方法、平台、服务器以及介质
本申请涉及在线支付的
,具体而言,本申请涉及一种外呼系统的语音合成方法、平台、服务器以及介质。
技术介绍
目前的智能外呼系统,一般是采用媒体资源控制协议(MediaResourceControlProtocol,MRCP),即通过流媒体的形式进行文字的语音合成,也就是文字可以一边合成为语音流,同时语音流可以一边被播放给客户听取。这样可以带来更小的延时,避免发生大段文字需要全部合成完语音之后再播放所带来的较长时间的等待。但同时也带来了相应的问题,即在租用的有限语音合成并发通路条件下,一段文字通过流媒体形式的语音合成,在全部的文字合成完并且合成的语音流全部播放完之前会一直占用使用的语音合成通路不会释放,进而在高并发的外呼通话情况下出现合成语音需要等待的情况,进而影响给客户的应答反馈速度,严重影响客户体验。换句话说,在有限语音合成能力并发通路的前提下,当出现高并发的外呼通话时,能获取到语音合成通路的一方确实能够实现较低延时的体验,但是不能获取语音合成通路的一方则有可能出现较长时间的等待来获取通路,进而导致在进行智能外呼应答时,容易出现有较大延时的情况。
技术实现思路
本申请针对现有方式的缺点,提出一种外呼系统的语音合成方法、平台、服务器以及介质,用以解决上述至少一个技术问题。第一方面,本申请实施例提供了一种外呼系统的语音合成方法,包括:互动式语音应答模块接收待合成文字段,将待合成文字段发送至中间件;中间件将待合成文字段切分成第一数量的单位文字段,并将第一数量的单位文字段发送至语音合成服务器,使得语音合成服务器基于各单位文字段在待合成文字段中的位置顺序,将第一数量的单位文字段合并成第二数量的子文字段;互动式语音应答模块基于各语音文件被合成的时间顺序,依次播放被语音合成服务器合成的各语音文件。在本申请的一个实施例中,将待合成文字段切分成第一数量的单位文字段,包括:中间件以待合成文字段中的标点符号作为切分位置,将待合成文字段切分成第一数量的单位文字段。在本申请的一个实施例中,基于各语音文件被合成的时间顺序,依次播放被语音合成服务器合成的各语音文件,包括:互动式语音应答模块根据中间件提供的存储路径确定出语音文件的存储位置,根据中间件提供的文件名称确定出第一个语音文件;互动式语音应答模块从第一个语音文件开始,基于各语音文件被合成的时间顺序依次播放存储位置中的各语音文件。第二方面,本申请实施例提供了一种外呼系统的语音合成方法,包括:接收中间件发送的第一数量的单位文字段;基于各单位文字段在待合成文字段中的位置顺序,将第一数量的单位文字段合并成第二数量的子文字段;基于各子文字段被合并的时间顺序,将各子文字段分别合成对应的语音文件并进行存储。在本申请的一个实施例中,基于各单位文字段在待合成文字段中的位置顺序,将第一数量的单位文字段合并成第二数量的子文字段,包括:基于各单位文字段在待合成文字段中的位置顺序,将第一数量的单位文字段中位置相邻的至少两个单位文字段作为一组;将每组单位文字段合并成一个子文字段,得到第二数量的子文字段。在本申请的一个实施例中,基于各子文字段被合并的时间顺序,将各子文字段分别合成对应的语音文件并进行存储,包括:每确定出一个子文字段合并完成后,将合并完成后的子文字段合成为对应的语音文件,基于中间件提供的存储路径将语音文件保存至存储位置;以及,在第一个语音文件合成完成后,基于中间件提供的文件名称为第一个语音文件命名。第三方面,本申请实施例提供了一种外呼平台,包括互动式语音应答模块和中间件;互动式语音应答模块和中间件分别执行本申请实施例第一方面提供的的外呼系统的语音合成方法中对应的步骤。第四方面,本申请实施例提供了一种语音合成服务器,包括存储器和处理器;处理器分别与存储器和外呼平台通信连接;存储器存储有计算机程序,计算机程序由处理器执行时,实现本申请实施例第二方面提供的外呼系统的语音合成方法。第五方面,本申请实施例提供了一种计算机可读存储介质,存储介质上存储有计算机程序,计算机程序被处理器执行时,实现本申请实施例第一方面提供的外呼系统的语音合成方法。第六方面,本申请实施例提供了一种计算机可读存储介质,存储介质上存储有计算机程序,计算机程序被处理器执行时,实现本申请实施例第二方面提供的外呼系统的语音合成方法。本申请实施例提供的技术方案,至少具有如下有益效果:应用本申请实施例提供的外呼系统的语音合成方法,在使用在有限语音合成能力并发通路的前提下,能够尽可能的满足高并发通话时的语音合成较低延时的需求,在节约成本的同时更大能力的发挥语音合成的能力效果,有效地提高了语音合成能力的利用率,从而降低了因等待获取语音合成而导致通路出现响应延时的机率,显著地提升了客户的使用体验。本申请附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本申请的实践了解到。附图说明本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本申请的一种外呼平台与语音合成服务器的通信示意图;图2为本申请的一种外呼系统的语音合成方法的流程示意图;图3为本申请提供的一种语音合成服务器的模块示意图。具体实施方式下面详细描述本申请,本申请的实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的部件或具有相同或类似功能的部件。此外,如果已知技术的详细描述对于示出的本申请的特征是不必要的,则将其省略。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。本
技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。本
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。首先对本申请涉及的专业名词做简单的解释说明:(智能)外呼系统,英文全称为IntelligentOutb本文档来自技高网
...

【技术保护点】
1.一种外呼系统的语音合成方法,其特征在于,包括:/n互动式语音应答模块接收待合成文字段,将所述待合成文字段发送至中间件;/n所述中间件将待合成文字段切分成第一数量的单位文字段,并将第一数量的所述单位文字段发送至语音合成服务器,使得所述语音合成服务器基于各所述单位文字段在待合成文字段中的位置顺序,将第一数量的所述单位文字段合并成第二数量的子文字段;/n互动式语音应答模块基于各语音文件被合成的时间顺序,依次播放被所述语音合成服务器合成的各所述语音文件。/n

【技术特征摘要】
1.一种外呼系统的语音合成方法,其特征在于,包括:
互动式语音应答模块接收待合成文字段,将所述待合成文字段发送至中间件;
所述中间件将待合成文字段切分成第一数量的单位文字段,并将第一数量的所述单位文字段发送至语音合成服务器,使得所述语音合成服务器基于各所述单位文字段在待合成文字段中的位置顺序,将第一数量的所述单位文字段合并成第二数量的子文字段;
互动式语音应答模块基于各语音文件被合成的时间顺序,依次播放被所述语音合成服务器合成的各所述语音文件。


2.根据权利要求1所述的语音合成方法,其特征在于,将待合成文字段切分成第一数量的单位文字段,包括:
所述中间件以待合成文字段中的标点符号作为切分位置,将所述待合成文字段切分成第一数量的单位文字段。


3.根据权利要求1所述的语音合成方法,其特征在于,基于各语音文件被合成的时间顺序,依次播放被所述语音合成服务器合成的各所述语音文件,包括:
所述互动式语音应答模块根据所述中间件提供的存储路径确定出所述语音文件的存储位置,根据所述中间件提供的文件名称确定出第一个语音文件;
所述互动式语音应答模块从所述第一个语音文件开始,基于各语音文件被合成的时间顺序依次播放所述存储位置中的各所述语音文件。


4.一种外呼系统的语音合成方法,其特征在于,包括:
接收中间件发送的第一数量的单位文字段;
基于各所述单位文字段在待合成文字段中的位置顺序,将第一数量的所述单位文字段合并成第二数量的子文字段;
基于各所述子文字段被合并的时间顺序,将各所述子文字段分别合成对应的语音文件并进行存储。


5.根据权利要求4所述的语音合成方法,其特征在于,基于各所述单位文字段...

【专利技术属性】
技术研发人员:张浩李志福艾巍张友权鹿江锋程榆汪博李蝉秀谢隆飞邵小亮
申请(专利权)人:中国建设银行股份有限公司建信金融科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1