外呼系统的接通时刻点判定方法、装置、设备和存储介质制造方法及图纸

技术编号：33969286 阅读：53 留言：0更新日期：2022-06-30 02:04

本发明专利技术公开了一种智能外呼系统接通时刻点判定方法和装置、存储介质，属于AI电话外呼领域。实时获取外呼机器人在外呼过程中的音频数据，若存在声音信号，则提取第一音频特征信号，判断属于人说话声或环境背景音的概率；对第一音频特征信号进行二次特征提取，取top n特征与上述概率拼接后判断属于人说话声或环境背景音的概率，若概率大于阈值，则将当前时刻点作为接通时刻点，向外呼机器人返回接通信号，结束本次外呼的接通时刻点判定。本发明专利技术采用深度学习模型和传统机器学习模型相结合的方案，减少对音频领域专家知识的依赖，无需调用asr技术获取语音转文本的中间结果，满足在实时性要求极强的二次外呼机器人场景中的应用。用。用。

全部详细技术资料下载

【技术实现步骤摘要】
外呼系统的接通时刻点判定方法、装置、设备和存储介质

[0001]本专利技术涉及AI电话外呼领域，尤其涉及一种智能外呼系统的接通时刻点判定方法、装置、设备和存储介质。

技术介绍

[0002]当前对个人隐私保护的重视程度越来越高，特别是个人隐私电话号码的保护，目前应用于多领域的智能外呼机器人在进行电话外呼时，都会采用虚拟分机号二次外呼的形式。在正常电话拨打时，当接收方接通时刻，电信、移动、联通等运营商会返回一个已接通信号，告知拨打方所拨打的电话已接通；不同于正常的电话拨打，在二次外呼场景下，外呼机器人首先接通运营商，再由运营商通过虚拟分机号进行二次外呼，当接收方在接通时刻，运营商已经不会再返回已接通信号，由于AI外呼机器人不能像人一样可以自己判断接收方是否接通，外呼机器人就无法知道接收方何时将电话接通，因此，AI电话外呼系统需要设置接通时刻点判定方法来生成一个已接通信号来告知外呼机器人。
[0003]对于二次外呼场景，在接通时刻前会产生以下状态的音频信号：1.静音状态，2.嘟嘟声状态，3.彩铃状态，4.机器提示音状态。接通时刻后会产生以下状态的音频信号：1.人说话声，2.环境背景音。AI外呼机器人正确的判定出二次外呼接通时刻点，可以极大的提高通话体验，减少接收方已接通后的等待回复时间。
[0004]传统技术通常在二次外呼后实时监听音频信号，利用asr（语音转文本）技术将音频信号转换为文本，通过对文本数据进行大量的规则判定来识别接通时刻，例如，匹配到第一个喂、你好等文本信号即认为此刻已接通；或者在上述文本数...

【技术保护点】

【技术特征摘要】
1.一种外呼系统的接通时刻点判定方法，其特征在于，包括以下步骤：步骤1，实时获取外呼机器人在外呼过程中的音频数据，对所述音频数据进行过滤，判断是否有声音信号，若无，则持续监听音频数据；若有，则从音频数据中提取第一音频特征信号；步骤2，利用第一机器学习模型判断第一音频特征信号属于人说话声或环境背景音的概率；步骤3，利用Yamnet模型对步骤1所述的第一音频特征信号进行二次特征提取，取top n 特征，并将步骤2得到的属于人说话声或环境背景音的概率与top n 特征拼接，得到第二音频特征信号；步骤4，利用第二机器学习模型判断第二音频特征信号属于人说话声或环境背景音的概率，若概率大于阈值，则将当前时刻点作为接通时刻点，向外呼机器人返回接通信号，结束本次外呼的接通时刻点判定，停止监听音频数据；否则，返回步骤1。2.根据权利要求1所述的外呼系统的接通时刻点判定方法，其特征在于，所述的实时获取外呼机器人在外呼过程中的音频数据时，每m毫秒采集一个音频片段，将获取到的音频片段存储在测试列表中，当测试列表的长度满足预设长度要求时，将测试列表中的音频数据全部取出并进行后续处理，同时持续监听音频片段，将新的音频片段存储在测试列表中。3.根据权利要求2所述的外呼系统的接通时刻点判定方法，其特征在于，10≤m≤30。4.根据权利要求1所述的外呼系统的接通时刻点判定方法，其特征在于，所述的步骤1中通过音频数据的能量值判断是否有声音信号，所述的声音信号包括人说话声和背景音。5.根据权利要求1所述的外呼系统的接通时刻点判定方法，其特征在于，所述的步骤1中采用wav2vec预训练模型从音频数据中提取第一音频特征信号。6.根据权利要求1所述的外呼系统的接通时刻点判定方法，其特征在于，利用Yamnet模型对步骤1所述的第一音频特征信号进行二次特征提取时，获得一个521维度的特征向量，保留top 100 特征用于后续处理...

【专利技术属性】
技术研发人员：王磊，
申请(专利权)人：杭州一知智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人