一种针对语音合成垃圾电话的检测识别方法及装置制造方法及图纸

技术编号:38156659 阅读:9 留言:0更新日期:2023-07-13 09:25
本发明专利技术公开一种针对语音合成垃圾电话的检测识别方法及装置,该方法包括:首先对合成语音样本和自然人语音样本分别提取自然度特征参数,训练生成合成语音检测模型;然后,对垃圾电话样本和正常电话样本分别提取通信行为特征参数,训练生成异常呼叫检测模型;其次,对待检测电话提取自然度特征,并进行合成语音检测;如果判定该电话不是合成语音,则结束流程,否则进一步提取该电话的通信行为特征,进行异常呼叫检测;如果判定该电话不是异常呼叫电话,则结束流程,否则判定其为基于语音合成技术生成的垃圾电话。本发明专利技术将合成语音检测模型和异常呼叫检测模型相结合,能够快速筛选出大量的正常电话,大大降低了垃圾电话检测的整体计算量。计算量。计算量。

【技术实现步骤摘要】
一种针对语音合成垃圾电话的检测识别方法及装置


[0001]本专利技术属于通信
,尤其涉及一种针对语音合成垃圾电话的检测识别方法及装置。

技术介绍

[0002]随着信息通信技术的发展,语音通信业务资费越来越低,这降低了人们工作和生活交流成本。因此,如何准确的识别并拦截垃圾骚扰电话对于维护清朗的网络空间和保护人民生命财产安全具有重要意义。
[0003]现有的公开技术方法一般是从通信行为和通信内容两个方面识别垃圾电话。在通信行为方面,主要是通过呼叫频次分析、来电号码标记等方法检测垃圾电话;在通信内容方面,主要是通过固定语音模板匹配、语音转文本后进行关键词匹配等方法检测垃圾电话。其中,基于呼叫频次分析的方法只能发现呼叫规律异常特征很明显的垃圾电话,其检测覆盖率较低,而基于来电号码标记的方法则依赖于接听者的主观判断,准确率较低;基于固定语音模板匹配和关键词匹配的方法,虽然具有较高的准确率,但是由于这类方法依赖于先验的目标样本,对于呼叫样本更新频繁、花样较多的垃圾电话显得力不从心,时效性较差。
[0004]尤其是语音合成技术的成熟化与工具化,使得不法分子可以更加方便的制作花样繁多的垃圾电话。基于语音合成技术,不法分子不仅可以节省大量的人力成本,还可以不断变换骚扰语音内容,以躲避现有的垃圾电话检测技术方法。

技术实现思路

[0005]针对现有技术难以有效、及时地检测基于语音合成技术的垃圾骚扰电话的问题,本专利技术提供了一种针对语音合成垃圾电话的检测识别方法及装置,提高了垃圾电话识别的准确性和时效性。
[0006]为了实现上述目的,本专利技术采用以下技术方案:本专利技术一方面提出一种针对语音合成垃圾电话的检测识别方法,包括:步骤1:将合成语音和自然人语音分别标记为正、负样本,随机选取一定比例的正、负样本作为训练集,剩余样本作为测试集;步骤2:对步骤1中的正、负样本分别提取自然度特征向量;步骤3:将所述自然度特征向量输入支持向量机SVM中进行训练,得到合成语音检测模型;步骤4:将垃圾电话和正常电话分别标记为正、负样本,随机选取一定比例的正、负样本作为训练集,剩余样本作为测试集;步骤5:对步骤4中的正、负样本分别提取通信行为特征向量;步骤6:将所述通信行为特征向量输入支持向量机SVM中进行训练,得到异常呼叫检测模型;步骤7:基于合成语音检测模型对待检测的电话样本进行合成语音检测;
步骤8:基于合成语音检测模型的检测结果,利用异常呼叫检测模型对待检测的电话样本进行异常呼叫检测。
[0007]进一步地,所述步骤7包括:对待检测的电话样本提取自然度特征向量,将提取的自然度特征向量输入训练好的合成语音检测模型,输出该电话样本的合成语音检测结果;如果输出结果为合成语音,则执行步骤8;否则结束检测流程。
[0008]进一步地,所述步骤8包括:对步骤7检测结果为合成语音的样本,提取其通信行为特征向量,输入训练好的异常呼叫检测模型,输出该电话样本的最终检测结果;如果输出结果是异常呼叫,则判定该电话样本为基于语音合成技术生成的垃圾电话;否则,结束检测流程。
[0009]本专利技术另一方面提出一种针对语音合成垃圾电话的检测识别装置,包括:第一数据集划分模块,用于将合成语音和自然人语音分别标记为正、负样本,随机选取一定比例的正、负样本作为训练集,剩余样本作为测试集;第一特征提取模块,用于对第一数据集划分模块中的正、负样本分别提取自然度特征向量;第一模型训练模块,用于将所述自然度特征向量输入支持向量机SVM中进行训练,得到合成语音检测模型;第二数据集划分模块,将垃圾电话和正常电话分别标记为正、负样本,随机选取一定比例的正、负样本作为训练集,剩余样本作为测试集;第二特征提取模块,用于对第二数据集划分模块中的正、负样本分别提取通信行为特征向量;第二模型训练模块,用于将所述通信行为特征向量输入支持向量机SVM中进行训练,得到异常呼叫检测模型;第一样本检测模块,用于基于合成语音检测模型对待检测的电话样本进行合成语音检测;第二样本检测模块,用于基于合成语音检测模型的检测结果,利用异常呼叫检测模型对待检测的电话样本进行异常呼叫检测。
[0010]进一步地,所述第一样本检测模块具体用于:对待检测的电话样本提取自然度特征向量,将提取的自然度特征向量输入训练好的合成语音检测模型,输出该电话样本的合成语音检测结果;如果输出结果为合成语音,则执行第二样本检测模块;否则结束检测流程。
[0011]进一步地,所述第二样本检测模块具体用于:对第一样本检测模块检测结果为合成语音的样本,提取其通信行为特征向量,输入训练好的异常呼叫检测模型,输出该电话样本的最终检测结果;如果输出结果是异常呼叫,则判定该电话样本为基于语音合成技术生成的垃圾电话;否则,结束检测流程。
[0012]与现有技术相比,本专利技术具有的有益效果:1、本专利技术利用自然度特征检测电话是否为合成语音,不依赖于先验的通话内容特征,即使不法分子不停地变换垃圾电话的话音内容,本专利技术也能实现有效检测,与基于固定语音模板匹配和关键词匹配的技术方法相比,具有一定的先进性,更加适用于检测识别语
音合成垃圾电话。
[0013]2、本专利技术利用通信行为特征检测垃圾电话,无需对通话内容特征进行深度分析,计算复杂度低,有利于实现对垃圾电话的快速识别。
[0014]3、通常情况下,正常电话不会采用合成语音进行呼叫。本专利技术首先进行合成语音检测,能够快速过滤掉大部分正常电话,大大降低后续的垃圾电话检测计算量,尤其适用于大规模电话呼叫实时检测的应用场景。
[0015]4、本专利技术整体技术方案包括训练和测试两个阶段,训练阶段可以离线执行,测试阶段可以在线执行。使用训练好的检测模型,能够快速高效地实施垃圾电话的检测识别,适用于在线检测业务场景,也能够实现垃圾电话的在线拦截功能。
附图说明
[0016]图1为本专利技术实施例一种针对语音合成垃圾电话的检测识别方法的流程图;图2为本专利技术实施例合成语音检测模型训练过程示意图;图3为本专利技术实施例异常呼叫检测模型训练过程示意图;图4为本专利技术实施例待检测的电话样本检测流程图;图5为本专利技术实施例一种针对语音合成垃圾电话的检测识别装置的结构示意图。
具体实施方式
[0017]下面结合附图和具体的实施例对本专利技术做进一步的解释说明:如图1所示,本专利技术的一种针对语音合成垃圾电话的检测识别方法,包括两个阶段:训练阶段和测试阶段。如虚线左侧所示的训练阶段,首先对合成语音样本和自然人语音样本分别提取自然度特征参数,然后训练生成合成语音检测模型;其次,对垃圾电话样本和正常电话样本分别提取通信行为特征参数,训练生成异常呼叫检测模型。如虚线右侧所示的测试阶段,首先对待检测电话提取自然度特征,并进行合成语音检测;如果判定该电话不是合成语音,则结束流程,否则进一步提取该电话的通信行为特征,进行异常呼叫检测;如果判定该电话不是异常呼叫电话,则结束流程,否则判定其为基于语音合成技术生成的垃圾电话。
[0018]该方法具体包括:步骤1:将合成语音和本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种针对语音合成垃圾电话的检测识别方法,其特征在于,包括:步骤1:将合成语音和自然人语音分别标记为正、负样本,随机选取一定比例的正、负样本作为训练集,剩余样本作为测试集;步骤2:对步骤1中的正、负样本分别提取自然度特征向量;步骤3:将所述自然度特征向量输入支持向量机SVM中进行训练,得到合成语音检测模型;步骤4:将垃圾电话和正常电话分别标记为正、负样本,随机选取一定比例的正、负样本作为训练集,剩余样本作为测试集;步骤5:对步骤4中的正、负样本分别提取通信行为特征向量;步骤6:将所述通信行为特征向量输入支持向量机SVM中进行训练,得到异常呼叫检测模型;步骤7:基于合成语音检测模型对待检测的电话样本进行合成语音检测;步骤8:基于合成语音检测模型的检测结果,利用异常呼叫检测模型对待检测的电话样本进行异常呼叫检测。2.根据权利要求1所述的一种针对语音合成垃圾电话的检测识别方法,其特征在于,所述步骤7包括:对待检测的电话样本提取自然度特征向量,将提取的自然度特征向量输入训练好的合成语音检测模型,输出该电话样本的合成语音检测结果;如果输出结果为合成语音,则执行步骤8;否则结束检测流程。3.根据权利要求2所述的一种针对语音合成垃圾电话的检测识别方法,其特征在于,所述步骤8包括:对步骤7检测结果为合成语音的样本,提取其通信行为特征向量,输入训练好的异常呼叫检测模型,输出该电话样本的最终检测结果;如果输出结果是异常呼叫,则判定该电话样本为基于语音合成技术生成的垃圾电话;否则,结束检测流程。4.一种针对语音合成垃圾电话的检测识别装置,其特征在于,包括:第一数据集划分模块,用于将合成语音和自然人语...

【专利技术属性】
技术研发人员:李星王凯刘树新何赞园李英乐朱宇航王庚润巩小锐
申请(专利权)人:中国人民解放军战略支援部队信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1