System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及人工智能,特别地,涉及机器人外呼系统、说话人识别;具体而言,涉及一种优化机器人外呼系统打断效果的方法及装置。
技术介绍
1、随着人工智能技术的飞速发展,机器人外呼系统在商业推广、客户服务、市场调研等领域得到了广泛应用。传统的机器人外呼系统主要通过声音检测模块(vad模块)检测用户是否打断机器人,从而实现人机交互。
2、然而,现有的vad模块只能过滤掉环境噪音,例如敲打桌子的声音、咳嗽声、风声、白噪声等,却无法有效过滤掉环境的人声干扰,例如其他非该用户的声音、背景人声噪声、电视播放的人声等。这就导致现有的机器人外呼系统在打断检测方面存在一定的局限性,影响了用户体验和交互效果。
3、为提高机器人外呼系统的打断检测准确率和响应速度,声纹识别技术在机器人外呼系统中的应用开始受到关注。声纹识别技术是一种生物识别技术,通过分析个体的声音特征,如音调、音色、语速等,识别和验证个体的身份。将声纹识别技术应用于机器人外呼系统,可以有效区分用户的声音和其他人声干扰,从而提高打断检测的准确率。
4、声纹信息的收集方式有两种:显式收集用户声纹信息和隐式收集用户声纹信息。其中,显式收集用户声纹信息是指用户在系统提示下,主动参与声纹注册过程。用户通常需按照系统指示,朗读特定的文本或短语,系统记录并分析这些语音样本,从中提取声纹特征,创建用户的声纹模型。显式收集通常能够提供高质量的声纹样本,因为用户在注册过程中会尽量提供清晰的发音,有助于保证声纹库中的声纹信息是准确和最新的。
5、但是,显式收集的
6、隐式收集用户声纹信息在在机器人外呼系统中比较适用。隐式收集用户声纹信息的方法更为便捷和自然,隐式收集无需用户主动参与声纹注册过程,而是在用户的日常语音交互中自动收集声纹信息。隐式收集的方法降低了用户的使用成本,提高了用户体验,并且可以更加隐蔽地收集声纹信息,减少了用户的隐私顾虑。
7、然而,隐式收集的声纹样本质量受限于用户的日常交流环境,如背景噪声、情绪变化等,而且需要较长时间积累足够的声纹样本,才能建立准确的声纹模型,处理复杂度较高。
技术实现思路
1、鉴于此,本专利技术的目的在于提出一种基于一种优化机器人外呼系统打断效果的方法及装置,在打断检测模型中添加声纹检测模块,实现对用户声音的有效识别和过滤;在设计外呼对话流程时融入声纹信息收集的节点,利用隐式收集的方式收集用户的声纹信息,通过比对当前语音输入信号和注册的用户声纹信息,判断是否为用户打断,从而提高打断检测的准确率和响应速度;收集过程在正常的对话交流中进行,能够在用户无感的情况下逐步建立并更新用户的声纹模型,收集的声纹信息在会话过程中相对稳定、不会有太大变化,从而提高声纹信息收集的隐蔽性和便利性,并保证声纹信息的准确性和时效性,为机器人外呼系统中的打断检测提供有力的技术支持,提升系统的交互效果和用户满意度。
2、本专利技术提供一种优化机器人外呼系统打断效果的方法,包括以下步骤:
3、s1、在外呼对话流程中设置用于隐式收集用户声纹信息的节点;在用户与机器人外呼系统交互之前的初始阶段,通过所述节点自动收集用户声纹信息(无需用户主动注册),作为用户的注册声纹特征进行存储;
4、s2、在用户与机器人外呼系统交互时,获取用户的语音输入信号,对语音输入信号进行预处理,提取实时声纹特征,将实时声纹特征输入声音检测模块:vad模块;调用vad模块,判断语音输入信号是噪声还是语音信号;如果vad模块判断语音输入信号为噪声,则不打断;如果vad模块判断语音输入信号为语音信号,则将当前实时声纹特征与已收集的注册声纹特征进行比对;
5、当用户与机器人外呼系统交互时,实时采集用户的语音输入信号,并对语音输入信号进行预处理,提取实时声纹特征;
6、s3、通过声纹比对算法计算当前实时声纹特征与注册声纹特征的相似度;预设相似度的阈值,根据阈值判断机器人外呼系统打断是否为用户本人打断,根据判断结果,执行相应的响应策略。
7、通过声纹对比算法可以有效识别用户的打断意图,提高机器人外呼系统的交互效果。同时,通过隐式声纹注册,简化了用户操作,提升了用户体验。
8、进一步地,所述s2步骤的vad模块判断噪声和语音信号的方法包括以下任一种或多种的组合:
9、设置声音能量阈值,当语音输入信号的声音能量低于该声音能量阈值时,vad模块判断为噪声;当语音输入信号的声音能量高于该声音能量阈值时,vad模块判断为语音信号;
10、设置声音持续时长阈值,只有当语音输入信号的声音持续时长超过该声音持续时长阈值时,vad模块才会判断为语音信号;
11、设置静默时长阈值,当语音输入信号中的静默时长超过该静默时长阈值时,vad模块判断为噪声;当语音输入信号中的静默时长不超过该静默时长阈值时,vad模块判断为语音信号;
12、设定语音输入信号的语音能量与噪声能量的比值的阈值,计算语音输入信号的语音能量与噪声能量的比值,当计算的比值高于设定阈值时,判断为语音信号;当计算的比值低于设定阈值时,判断为噪声;
13、通过分析语音输入信号的声音频率特征,判断语音输入信号是否包含语音频率成分;如果语音输入信号包含语音频率成分,则判断为语音信号;如果语音输入信号不包含语音频率成分,则判断为噪声;
14、利用机器学习模型对语音输入信号进行分类,判断语音输入信号为噪声还是语音信号。
15、机器学习模型可采用神经网络结构,通过大量噪声和语音信号数据对该机器学习模型进行训练。
16、通过设置和调整上述参数,vad模块可以有效判断语音输入信号是噪声还是语音信号,从而提高机器人外呼系统打断检测的准确性。
17、进一步地,所述s3步骤的预设相似度的阈值的方法包括以下任一种或多种的组合:
18、实验法确定阈值:通过对一定数量的样本进行测试,绘制出实时声纹特征与注册声纹特征之间余弦相似度的分布图,选择一个合适的相似度阈值,使得识别效果达到最优;例如,在测试样本中,余弦相似度分布在0.5-1之间,那么可以选择0.7作为阈值,超过0.7时认为为用户本人打断。
19、经验法确定阈值:根据经验确定阈值,基于通常人的声纹相似度在0.8以上,选择0.8作为阈值;阈值选择需要兼顾准确性和误识别率,一般而言,阈值越高,误识别率越低,但准确率也会相应下降。
20、基于业务需求确定阈值:根据具体业务对准确性和效率的要求,确定一个合适的阈值。例如,在金融支付场景中,需要更高的准确率,可以选择0.9以上的阈值;而在普通客服场景中,可以选择0.7左右的阈值。
21、阈值的选择需综合考虑样本测试结果、业务需求、准确性与效率等因素,通本文档来自技高网...
【技术保护点】
1.一种优化机器人外呼系统打断效果的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的优化机器人外呼系统打断效果的方法,其特征在于,所述S2步骤的VAD模块判断噪声和语音信号的方法包括以下任一种或多种的组合:
3.根据权利要求1所述的优化机器人外呼系统打断效果的方法,其特征在于,所述S3步骤的预设相似度的阈值的方法包括以下任一种或多种的组合:
4.根据权利要求1所述的优化机器人外呼系统打断效果的方法,其特征在于,所述S2步骤的实时声纹特征包括:
5.根据权利要求3所述的优化机器人外呼系统打断效果的方法,其特征在于,所述S3步骤的计算当前语音输入信号与用户注册声纹特征的相似度的方法包括:
6.根据权利要求1所述的优化机器人外呼系统打断效果的方法,其特征在于,所述S3步骤的根据判断结果,执行相应的响应策略的方法包括:
7.一种优化机器人外呼系统打断效果的装置,执行如权利要求1-6任一项所述的优化机器人外呼系统打断效果的方法,其特征在于,包括:
8.根据权利要求7所述的优化机器人外呼系统打断效果
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1-6任一项所述的优化机器人外呼系统打断效果的方法的步骤。
10.一种计算机设备,所述计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6任一项所述的优化机器人外呼系统打断效果的方法的步骤。
...【技术特征摘要】
1.一种优化机器人外呼系统打断效果的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的优化机器人外呼系统打断效果的方法,其特征在于,所述s2步骤的vad模块判断噪声和语音信号的方法包括以下任一种或多种的组合:
3.根据权利要求1所述的优化机器人外呼系统打断效果的方法,其特征在于,所述s3步骤的预设相似度的阈值的方法包括以下任一种或多种的组合:
4.根据权利要求1所述的优化机器人外呼系统打断效果的方法,其特征在于,所述s2步骤的实时声纹特征包括:
5.根据权利要求3所述的优化机器人外呼系统打断效果的方法,其特征在于,所述s3步骤的计算当前语音输入信号与用户注册声纹特征的相似度的方法包括:
6.根据权利要求1所述的优化机器人外呼系统打断效果的方法...
【专利技术属性】
技术研发人员:司玉景,李全忠,何国涛,蒲瑶,
申请(专利权)人:普强时代珠海横琴信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。