【技术实现步骤摘要】
一种针对语音合成垃圾电话的检测识别方法及装置
[0001]本专利技术属于通信
,尤其涉及一种针对语音合成垃圾电话的检测识别方法及装置。
技术介绍
[0002]随着信息通信技术的发展,语音通信业务资费越来越低,这降低了人们工作和生活交流成本。因此,如何准确的识别并拦截垃圾骚扰电话对于维护清朗的网络空间和保护人民生命财产安全具有重要意义。
[0003]现有的公开技术方法一般是从通信行为和通信内容两个方面识别垃圾电话。在通信行为方面,主要是通过呼叫频次分析、来电号码标记等方法检测垃圾电话;在通信内容方面,主要是通过固定语音模板匹配、语音转文本后进行关键词匹配等方法检测垃圾电话。其中,基于呼叫频次分析的方法只能发现呼叫规律异常特征很明显的垃圾电话,其检测覆盖率较低,而基于来电号码标记的方法则依赖于接听者的主观判断,准确率较低;基于固定语音模板匹配和关键词匹配的方法,虽然具有较高的准确率,但是由于这类方法依赖于先验的目标样本,对于呼叫样本更新频繁、花样较多的垃圾电话显得力不从心,时效性较差。
[0004]尤其是语 ...
【技术保护点】
【技术特征摘要】
1.一种针对语音合成垃圾电话的检测识别方法,其特征在于,包括:步骤1:将合成语音和自然人语音分别标记为正、负样本,随机选取一定比例的正、负样本作为训练集,剩余样本作为测试集;步骤2:对步骤1中的正、负样本分别提取自然度特征向量;步骤3:将所述自然度特征向量输入支持向量机SVM中进行训练,得到合成语音检测模型;步骤4:将垃圾电话和正常电话分别标记为正、负样本,随机选取一定比例的正、负样本作为训练集,剩余样本作为测试集;步骤5:对步骤4中的正、负样本分别提取通信行为特征向量;步骤6:将所述通信行为特征向量输入支持向量机SVM中进行训练,得到异常呼叫检测模型;步骤7:基于合成语音检测模型对待检测的电话样本进行合成语音检测;步骤8:基于合成语音检测模型的检测结果,利用异常呼叫检测模型对待检测的电话样本进行异常呼叫检测。2.根据权利要求1所述的一种针对语音合成垃圾电话的检测识别方法,其特征在于,所述步骤7包括:对待检测的电话样本提取自然度特征向量,将提取的自然度特征向量输入训练好的合成语音检测模型,输出该电话样本的合成语音检测结果;如果输出结果为合成语音,则执行步骤8;否则结束检测流程。3.根据权利要求2所述的一种针对语音合成垃圾电话的检测识别方法,其特征在于,所述步骤8包括:对步骤7检测结果为合成语音的样本,提取其通信行为特征向量,输入训练好的异常呼叫检测模型,输出该电话样本的最终检测结果;如果输出结果是异常呼叫,则判定该电话样本为基于语音合成技术生成的垃圾电话;否则,结束检测流程。4.一种针对语音合成垃圾电话的检测识别装置,其特征在于,包括:第一数据集划分模块,用于将合成语音和自然人语...
【专利技术属性】
技术研发人员:李星,王凯,刘树新,何赞园,李英乐,朱宇航,王庚润,巩小锐,
申请(专利权)人:中国人民解放军战略支援部队信息工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。