一种智能电话应答方法和系统技术方案

技术编号:24520983 阅读:89 留言:0更新日期:2020-06-17 07:56
本发明专利技术公开了一种智能电话应答方法,基于智能应答平台和声音复刻平台,包括采集被叫用户的声音数据,上传至声音复刻平台对其进行解析和声学模型训练并制成可编辑的私人音库;智能应答平台调用所述私人音库形成音频文件进行电话转接,以供与主叫用户进行电话语音交互;智能应答平台获取并记录通话过程中的通话信息供被叫用户接收。本发明专利技术还提供一种智能电话应答系统:包括被叫用户前端、智能应答平台、声音复刻平台和通信运营系统。本发明专利技术可以让被叫用户方便地自定义属于本人的智能应答音库,增强语音应答中被叫用户与系统的交互性和合成音的自然性,能让主叫用户认为是在与被叫用户本人进行交流,增加通电话的好感度从而顺利告知来电的目的等。

【技术实现步骤摘要】
一种智能电话应答方法和系统
本专利技术涉及智能语音应答领域,尤其是一种智能电话应答方法和系统。
技术介绍
在现代社会中,广告推销或骚扰电话越来越多,人们既不想浪费时间接听陌生的推销和骚扰电话,又担心错过重要信息,例如客户电话、银行通知、快递通知和面试邀约等,而且有时因为忙碌无法接听电话时可能会错过重要电话。针对此情况,目前存在着智能应答类软件来帮助被叫用户接听电话,现有的智能应答类软件中音库作为合成语音应答时的声音来源,音库一般为采用TTS合成音库(TexttoSpeech,TTS技术能够自动将任意文字实时转换为连续的自然语音)或事先录制的主播音库,来合成智能应答电话助理声音,在为被叫用户代接电话后,使用合成音库或主播音库内的音源合成电话助理的声音与主叫用户进行语音问答交流。然而,一方面,这两种音库一般都是由智能应答类软件的厂家负责采集和制作而成的标准音库,对于被叫用户而言只能被动从标准音库中选择一种或几种来使用,无法自制音库或对音库进行自定义编辑,交互性和娱乐性差。另一方面,对于普通的TTS合成音库而言,声音自然度和流畅度不够高,语气上也生硬,主叫用户能够明显知道是智能应答类软件代接的电话,降低了沟通交流的积极性,影响来电交互体验;由于语音交流体验差,主叫用户可能会质疑该软件的智能程度,导致主叫用户选择结束交流,最终被叫用户并没有得到有效的通话信息,例如目前在各种运营商领域、银行中使用的部分智能语音应答系统一般采用TTS合成音库(包括智能电话客服、智能前台等),机器化程度非常明显,语气、声音都略显僵硬;语意的识别精确度不高,不能完整识别语义意图,导致大部分客户无法第一时间呈现需求,容易直接跳过智能客服找人工客服;对于主播音库而言,可以对主播进行多种声音风格的录制,虽然能够保证声音的流畅度、语气表达等,但是对于一些认识被叫被叫用户的主叫用户,有重要的信息通知到对方时,他们希望在电话中直接与被叫用户本人沟通并及时得到回应,而不是通过别人转达的方式。这类产品在代接电话时虽然有较好的听觉体验,但在听到主播声音时,能够轻易分辨出不是被叫被叫用户本人接听电话,从而降低交流沟通意愿,也导致被叫用户无法及时了解主叫用户的重要信息。
技术实现思路
本专利技术目的在于针对上述
技术介绍
中存在的问题,提供一种智能电话应答方法和系统,被叫用户可方便地自定义和训练属于本人的用于合成智能应答语音的音库,增强语音应答中被叫用户与系统的交互性和合成音的自然性,可以让主叫用户认为是在与被叫用户本人进行交流,增加通电话的好感度从而顺利告知来电的目的等,防止被叫用户错过重要电话中的信息。为了达到上述目的,本专利技术的技术方案有:一种智能电话应答方法,基于智能应答平台和声音复刻平台,包括如下步骤:采集被叫用户的声音数据;将所述声音数据经由所述智能应答平台上传至声音复刻平台,所述声音复刻平台对所述声音信息进行解析和声学模型训练并制成私人音库,被叫用户对所述私人音库具有编辑权限;所述智能应答平台接收主叫用户的电话呼叫转移信号后,调用所述私人音库形成音频文件,以供与所述主叫用户进行电话语音交互;所述智能应答平台获取并记录通话过程中的通话信息,以供被叫用户接收。在本方法中,不同于现有技术中音库都是开发商预设的标准音库,通过私人音库制作步骤,可以由被叫用户本人随时录制属于自己的私人音库,而且录制的声音并非直接用于合成音频文件,而是先利用声音复刻平台对其做解析和声学模型训练,使其在用于合成音频文件的时候更加自然流畅,且贴近真人说话的声音,可以让主叫用户有更好的电话交互体验。在音库的声音数据是被叫用户本人的基础上,被叫用户本人对私人音库还具有编辑的权限,因此被叫用户可以随时对私人音库进行编辑,例如被叫用户还可以根据自己的需要或兴趣爱好,录制多个本人的私人音库,以供选择,适用于不同场合下使用不同的音库;若是被叫用户对录制的私人音库不满意也可以随时将其删除,还可以对其进行命名、做标记等。通过上述操作,作为合成接听电话时音频文件的音库实现方便地由被叫用户自定义,自发进行,音库的种类和数量不再是由开发者来决定,被叫用户与执行的系统之间的交互性更高,增强了整个方法的趣味性和娱乐性。在此基础上,智能应答平台进行电话语音交互的过程中,通过调用上一步被叫用户自定义的私人音库可以合成十分近似被叫用户本人说话的自然流畅的音频文件,在向主叫用户播放音频文件时,很容易让主叫用户以为是在和被叫用户本人交流,交流意愿较强从而顺利告知来电目的。告知来电目的之后再将来电过程中的通话信息(包括主叫用户身份、来电时间、来电目的、是否需要回电等信息)经过提取之后记录下来供被叫用户在方便的时候查看,这样,就算被叫用户无法或因为任何理由不愿意接电话时,只要采用本专利技术中的方法来智能接听电话,就不会错过电话中的重要信息。进一步地,获取并记录通话信息后将所述通话信息以文本信息形式发送至被叫用户的通讯设备上。通过与互联网短信网关或短信中心相连接,可以将信息记录步骤中提取记录下来的通话信息直接以短信的形式发送到被叫用户的通讯设备上,避免被叫用户错过查看通话信息。进一步地,所述智能应答步骤在被叫用户无法接听电话或主动拒绝接听电话时启动。保证了既不会影响被叫用户正常的电话接听,又可以避免错过电话,尤其是被叫用户主动拒绝接听电话时避免客户直面不想接的电话,更加人性化。进一步地,所述电话语音交互的过程具体包括:电话通讯线路接通后,先播放采用所述私人音库合成的初始引导音频文件,根据主叫用户的回复实时制定回复内容,根据回复内容调用所述私人音库合成用户电话语音交互的音频文件。接听电话后先播放初始引导音频文件相当于播放开场白,而非让打电话的人先说话,可以掌握对话的主动权,能快速得知主叫用户的来电目的和来电身份,再结合内容后可以帮助迅速判断来电意图,减小自动判断的难度,提高判断准确度。进一步地,所述私人音库包括两个以上,选择其中一个私人音库合成音频文件。多个私人音库可以为被叫用户提供更多的自定义空间,每次选择一个私人音库可以保证在电话接听时语音风格统一,使得主叫用户在接听电话时听到的语音更加自然和贴近真人。进一步地,所述私人音库包括默认音库和一个以上备选音库,所述初始引导音频文件调用所述默认音库合成;播放所述初始引导音频文件后,根据主叫用户的回复优先获取主叫用户的个人身份和来电目的,根据所述个人身份和来电目的切换为备选音库调用或继续调用默认音库。在播放初始引导音频文件时,还不清楚主叫用户的身份,因此可以先用默认音库对其进行引导询问,在得知主叫用户的个人身份和来电目的后,根据实际情况来切换备选音库可以达到对语气的修正,灵活性和适应性更强,而且可以使得通话更加自然,与真人接电话的场景近似程度更高。例如,当判断为亲密朋友邀约时,可以调用语气亲昵的备选音库来进行接下来的对话;当判断为客户来电询问公事时,可以切换为严肃正经的备选音库来继续对话。进一步地,标记每个所述备选音库,所述标记信息包括本备选音库适合使用的主叫用户个人身份和来电目的;获取主叫本文档来自技高网
...

【技术保护点】
1.一种智能电话应答方法,其特征在于:基于智能应答平台和声音复刻平台,包括如下步骤:/n采集被叫用户的声音数据;/n将所述声音数据经由所述智能应答平台上传至声音复刻平台,所述声音复刻平台对所述声音信息进行解析和声学模型训练并制成私人音库,被叫用户对所述私人音库具有编辑权限;/n所述智能应答平台接收主叫用户的电话呼叫转移信号后,调用所述私人音库形成音频文件,以供与所述主叫用户进行电话语音交互;/n所述智能应答平台获取并记录通话过程中的通话信息,以供被叫用户接收。/n

【技术特征摘要】
1.一种智能电话应答方法,其特征在于:基于智能应答平台和声音复刻平台,包括如下步骤:
采集被叫用户的声音数据;
将所述声音数据经由所述智能应答平台上传至声音复刻平台,所述声音复刻平台对所述声音信息进行解析和声学模型训练并制成私人音库,被叫用户对所述私人音库具有编辑权限;
所述智能应答平台接收主叫用户的电话呼叫转移信号后,调用所述私人音库形成音频文件,以供与所述主叫用户进行电话语音交互;
所述智能应答平台获取并记录通话过程中的通话信息,以供被叫用户接收。


2.根据权利要求1所述的智能电话应答方法,其特征在于:获取并记录通话信息后将所述通话信息以文本信息形式发送至被叫用户的通讯设备上。


3.根据权利要求1所述的智能电话应答方法,其特征在于:所述智能应答步骤在被叫用户无法接听电话或主动拒绝接听电话时启动。


4.根据权利要求1所述的智能电话应答方法,其特征在于:所述电话语音交互的过程具体包括:电话通讯线路接通后,先播放采用所述私人音库合成的初始引导音频文件,根据主叫用户的回复实时制定回复内容,根据回复内容调用所述私人音库合成用户电话语音交互的音频文件。


5.根据权利要求4所述的智能电话应答方法,其特征在于:所述私人音库包括两个以上,选择其中一个私人音库合成音频文件。


6.根据权利要求4所述的智能电话应答方法,其特征在于:
所述私人音库包括默认音库和一个以上备选音库,所述初始引导音频文件调用所述默认音库合成;
播放所述初始引导音频文件后,根据主叫用户的回复优先获取主叫用户的个人身份和来电目的,根据所述个人身份和来电目的切换为备选音库调用或继续调用默认音库。


7.根据权利要求6所述的智能电话应答方法,其特征在于:
标记每个所述备选音库,所述标记信息包括本备选音库适合使用的主叫用户个人身份和来电目的;
获取主叫用户的个人身份和来电目的,分别与每个所述备选音库的标记进行比对,判断存在备选音库标记中的个人身份与来电目的与主叫用户一致时,将当前调用的默认音库切换至该备选音库;否则继续调用当前默认音库。


8.根据权利要求7所述的智能电话应答方...

【专利技术属性】
技术研发人员:陈源凯章军麦永恒
申请(专利权)人:广州市讯飞樽鸿信息技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1