一种智能电话语音机器人控制方法技术

技术编号:37671489 阅读:15 留言:0更新日期:2023-05-26 04:33
本发明专利技术提供一种智能电话语音机器人控制方法,属于语音处理技术领域,具体包括:基于用户的语音进行MFCC特征提取,确定用户的身份;基于用户的语音得到正面关键词匹配数量和负面关键词匹配数量;基于负面关键词匹配数量以及正面关键词匹配数量确定存在还款意愿时,基于深度均值高斯超矢量特征、MFCC特征、高斯超矢量特征构建融合特征,基于融合特征采用基于ISSA

【技术实现步骤摘要】
一种智能电话语音机器人控制方法


[0001]本专利技术属于语音处理
,尤其涉及一种智能电话语音机器人控制方法。

技术介绍

[0002]为了实现对用户的语音的解析,在授权专利技术专利CN112735479B《一种语音识别的方法及语音机器人系统》中通过采集用户的语音信息;将采集到的信息转换为文字信息;将转换后的文字信息进行矫正,矫正后的文字信息作为识别信息;根据识别信息作出反馈,从而显著地提高了语音识别的准确率,但是却存在以下技术问题:1、未能实现对用户的声音特征以及关键信息的提取,在进行电话催收管理时,有可能会存在用户故意说你打错了等不配合的情况的出现,若不能结合用户以往的声音特征确定用户的身份再针对性的调整催收策略,从而会导致催收效率降低以及无法实现对用户的身份的确认。
[0003]2、忽视了基于用户的通话时长、情绪识别结果、关键词匹配数量,实现对用户的还款意愿度的确定,当用户说尽量配合、还款计划修改等等关键词时,其还款意愿度明显要高于没钱、不还钱等等关键词的用户,因此若不针对语音识别结果进行关键词匹配,也会使得催收的效率会有所降低。
[0004]针对上述技术问题,本专利技术提供了一种智能电话语音机器人控制方法。

技术实现思路

[0005]为实现本专利技术目的,本专利技术采用如下技术方案:根据本专利技术的一个方面,提供了一种智能电话语音机器人控制方法。
[0006]一种智能电话语音机器人控制方法,其特征在于,具体包括:S11基于用户的语音进行MFCC特征提取,并基于所述MFCC特征确定所述用户的身份,当所述用户的身份不正确时,输出用户身份存疑,需要挂断处理,否则则进入下一步骤;S12基于所述用户的语音进行关键词提取得到语音关键词,并基于所述语音关键词与关键词库的匹配结果,得到正面关键词匹配数量和负面关键词匹配数量;S13基于所述负面关键词匹配数量以及正面关键词匹配数量确定所述用户是否有还款意愿,若否,则输出用户的还款意愿低,提升催收频率,若是,则进入下一步骤;S14基于所述MFCC特征,采用DNN

GMM模型得到深度均值高斯超矢量特征,基于GMM模型直接对所述MFCC特征进行处理得到高斯超矢量特征,基于所述深度均值高斯超矢量特征、MFCC特征、高斯超矢量特征构建融合特征得到情绪识别结果,并基于所述情绪识别结果、通话时长、负面关键词匹配数量、正面关键词匹配数量,构建预测模型,得到所述用户的还款意愿度,并基于所述用户的还款意愿度确定催收频率。
[0007]通过首先基于MFCC特征实现对用户身份的识别,从而实现了对所述用户的身份的首先识别,对于身份存疑的用户不再进行进一步的分析,从而在保证系统运行效率和可靠性的基础上,进一步保证了催收的效率,进一步减少了由于换号或者故意撒谎的用户导致
的催收效率较低的技术问题的出现。
[0008]通过采用关键词的匹配的数量实现对用户的还款意愿度的评估,从而采用较为简单且效率较高的手段实现了对用户的还款意愿度的评估,进一步提升了对于用户的还款意愿度的评估的效率,也减少了需要进行情绪识别结果构建的用户的数量,进一步提升了整体的效率。
[0009]通过深度均值高斯超矢量特征、MFCC特征、高斯超矢量特征构建融合特征,基于所述融合特征得到情绪识别结果,从而避免了采用单一的特征导致的准确率较低的技术问题的出现,并进一步保留了MFCC特征的高维特征,进一步提升了情绪识别结果的准确性。
[0010]通过基于情绪识别结果、通话时长、负面关键词匹配数量、正面关键词匹配数量,构建预测模型,得到所述用户的还款意愿度,从而不仅仅单纯依靠情感度的评价结果,而是与关键词的匹配结果相结合,实现了从多维度对还款意愿度的评价,也为针对性的进行催收策略的指定奠定了基础。
[0011]另一方面,本申请实施例中提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时,实现上述的一种智能电话语音机器人控制方法。
[0012]另一方面,本专利技术提供了一种计算机存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述的一种智能电话语音机器人控制方法。
[0013]其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
[0014]为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
[0015]通过参照附图详细描述其示例实施方式,本专利技术的上述和其它特征及优点将变得更加明显;图1是一种智能电话语音机器人控制方法的流程图;图2是确定用户的身份的具体步骤的流程图;图3是情绪识别结果构建的具体步骤的流程图;图4是用户的还款意愿度构建的具体步骤的流程图;图5是改进型算法的性能对比的框架图;图6是一种计算机存储介质的框架图。
具体实施方式
[0016]现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式;相反,提供这些实施方式使得本专利技术将全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。图中相同的附图标记表示相同或类似的结构,因而将省略它们的详细描述。
[0017]用语“一个”、“一”、“该”、“所述”用以表示存在一个或多个要素/组成部分/等;用
其中为第n维的历史语音的MFCC特征。
[0025]在本实施例中,通过首先基于MFCC特征采用欧式距离的方式实现对用户身份的识别,从而实现了对所述用户的身份的首先识别,对于身份存疑的用户不再进行进一步的分析,从而在保证系统运行效率和可靠性的基础上,进一步保证了催收的效率,进一步减少了由于换号或者故意撒谎的用户导致的催收效率较低的技术问题的出现。
[0026]S12基于所述用户的语音进行关键词提取得到语音关键词,并基于所述语音关键词与关键词库的匹配结果,得到正面关键词匹配数量和负面关键词匹配数量;具体的,关键词库根据历史通话记录以及专家的方式进行确定,关键词库可以有不愿意、没钱、不考虑还钱等负面关键词,同时还包括愿意、同意、马上还、考虑还钱等正面关键词。
[0027]S13基于所述负面关键词匹配数量以及正面关键词匹配数量确定所述用户是否有还款意愿,若否,则输出用户的还款意愿低,提升催收频率,若是,则进入下一步骤;需要说明的是,当负面关键词匹配数量较少,且同时正面关键词匹配数量较多时,则确定用户存在还款意愿。
[0028]通过采用关键词的匹配的数量实现对用户的还款意愿度的评估,从而采用较为简单且效率较高的手段实现了对用户的还款意愿度的评估,进一步提升了对于用户的还款意愿度的评估的效率,也减少了需要进行情绪识别结果构建的用户的数量,进一步提升了整体的效率。
[0029]S14基于所述MFCC特征,采用DNN

G本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能电话语音机器人控制方法,其特征在于,具体包括:基于用户的语音进行MFCC特征提取,并基于所述MFCC特征确定所述用户的身份,当所述用户的身份不正确时,输出用户身份存疑,需要挂断处理,否则则进入下一步骤;基于所述用户的语音进行关键词提取得到语音关键词,并基于所述语音关键词与关键词库的匹配结果,得到正面关键词匹配数量和负面关键词匹配数量;基于所述负面关键词匹配数量以及正面关键词匹配数量确定所述用户是否有还款意愿,若否,则输出用户的还款意愿低,提升催收频率,若是,则进入下一步骤;基于所述MFCC特征,采用DNN

GMM模型得到深度均值高斯超矢量特征,基于GMM模型直接对所述MFCC特征进行处理得到高斯超矢量特征,基于所述深度均值高斯超矢量特征、MFCC特征、高斯超矢量特征构建融合特征得到情绪识别结果,并基于所述情绪识别结果、通话时长、负面关键词匹配数量、正面关键词匹配数量,构建预测模型,得到所述用户的还款意愿度,并基于所述用户的还款意愿度确定催收频率。2.如权利要求1所述的智能电话语音机器人控制方法,其特征在于,在进行MFCC特征提取之前,还需要对所述用户的声音进行A/D 转换和预加重处理。3.如权利要求1所述的智能电话语音机器人控制方法,其特征在于,确定所述用户的身份的具体步骤为:判断所述用户是否存在历史通话声音,若是,则基于所述历史通话声音进行MFCC特征提取得到历史MFCC特征,若否,则无法对所述用户的身份进行确定;基于所述历史MFCC特征、MFCC特征,分别基于马氏距离函数、欧式距离函数获得所述历史MFCC特征和MFCC特征之间的马氏距离相似度和欧式距离相似度,并基于所述马氏距离相似度和欧式距离相似度构建综合相似度,并基于所述综合相似度确定所述用户的身份是否准确,若是,则用户的身份确认成功,若否,则进入下一步骤;基于马氏距离相似度、欧式距离相似度构建输入集,并将所述输入集传输至基于SVM算法的分类模型中,得到预测结果,并基于所述预测结果确定所述用户的身份。4.如权利要求3所述的智能电话语音机器人控制方法,其特征在于,所述综合相似度的计算公式为:其中S1、S2分别为马氏距离相似度、欧式距离相似度,ε为相似度阈值为常数,max()为取最大值函数,min()为取最小值函数。5.如权利要求4所述的智能电话语音机器人控制方法,其特征在于,所述马氏距离相似度根据历史MFCC特征、MFCC特征的向量值的协方差矩阵以及所述历史MFCC特征的向量值、MFCC特征的向量值进行确定。6.如权利要求1所述的智能电话语音机器人控制方法,其特征在于,所述情绪识别结果构建的具体步骤为:判断所述用户的通话时长是否大于设定时长,若是,则进入下一步骤,若否,...

【专利技术属性】
技术研发人员:马荣
申请(专利权)人:杭州度言软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1