一种针对语音合成垃圾电话的检测识别方法及装置制造方法及图纸

技术编号:38156659 阅读:35 留言:0更新日期:2023-07-13 09:25
本发明专利技术公开一种针对语音合成垃圾电话的检测识别方法及装置,该方法包括:首先对合成语音样本和自然人语音样本分别提取自然度特征参数,训练生成合成语音检测模型;然后,对垃圾电话样本和正常电话样本分别提取通信行为特征参数,训练生成异常呼叫检测模型;其次,对待检测电话提取自然度特征,并进行合成语音检测;如果判定该电话不是合成语音,则结束流程,否则进一步提取该电话的通信行为特征,进行异常呼叫检测;如果判定该电话不是异常呼叫电话,则结束流程,否则判定其为基于语音合成技术生成的垃圾电话。本发明专利技术将合成语音检测模型和异常呼叫检测模型相结合,能够快速筛选出大量的正常电话,大大降低了垃圾电话检测的整体计算量。计算量。计算量。

【技术实现步骤摘要】
一种针对语音合成垃圾电话的检测识别方法及装置


[0001]本专利技术属于通信
,尤其涉及一种针对语音合成垃圾电话的检测识别方法及装置。

技术介绍

[0002]随着信息通信技术的发展,语音通信业务资费越来越低,这降低了人们工作和生活交流成本。因此,如何准确的识别并拦截垃圾骚扰电话对于维护清朗的网络空间和保护人民生命财产安全具有重要意义。
[0003]现有的公开技术方法一般是从通信行为和通信内容两个方面识别垃圾电话。在通信行为方面,主要是通过呼叫频次分析、来电号码标记等方法检测垃圾电话;在通信内容方面,主要是通过固定语音模板匹配、语音转文本后进行关键词匹配等方法检测垃圾电话。其中,基于呼叫频次分析的方法只能发现呼叫规律异常特征很明显的垃圾电话,其检测覆盖率较低,而基于来电号码标记的方法则依赖于接听者的主观判断,准确率较低;基于固定语音模板匹配和关键词匹配的方法,虽然具有较高的准确率,但是由于这类方法依赖于先验的目标样本,对于呼叫样本更新频繁、花样较多的垃圾电话显得力不从心,时效性较差。
[0004]尤其是语音合成技术的成熟化与本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种针对语音合成垃圾电话的检测识别方法,其特征在于,包括:步骤1:将合成语音和自然人语音分别标记为正、负样本,随机选取一定比例的正、负样本作为训练集,剩余样本作为测试集;步骤2:对步骤1中的正、负样本分别提取自然度特征向量;步骤3:将所述自然度特征向量输入支持向量机SVM中进行训练,得到合成语音检测模型;步骤4:将垃圾电话和正常电话分别标记为正、负样本,随机选取一定比例的正、负样本作为训练集,剩余样本作为测试集;步骤5:对步骤4中的正、负样本分别提取通信行为特征向量;步骤6:将所述通信行为特征向量输入支持向量机SVM中进行训练,得到异常呼叫检测模型;步骤7:基于合成语音检测模型对待检测的电话样本进行合成语音检测;步骤8:基于合成语音检测模型的检测结果,利用异常呼叫检测模型对待检测的电话样本进行异常呼叫检测。2.根据权利要求1所述的一种针对语音合成垃圾电话的检测识别方法,其特征在于,所述步骤7包括:对待检测的电话样本提取自然度特征向量,将提取的自然度特征向量输入训练好的合成语音检测模型,输出该电话样本的合成语音检测结果;如果输出结果为合成语音,则执行步骤8;否则结束检测流程。3.根据权利要求2所述的一种针对语音合成垃圾电话的检测识别方法,其特征在于,所述步骤8包括:对步骤7检测结果为合成语音的样本,提取其通信行为特征向量,输入训练好的异常呼叫检测模型,输出该电话样本的最终检测结果;如果输出结果是异常呼叫,则判定该电话样本为基于语音合成技术生成的垃圾电话;否则,结束检测流程。4.一种针对语音合成垃圾电话的检测识别装置,其特征在于,包括:第一数据集划分模块,用于将合成语音和自然人语...

【专利技术属性】
技术研发人员:李星王凯刘树新何赞园李英乐朱宇航王庚润巩小锐
申请(专利权)人:中国人民解放军战略支援部队信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1