一种基于HOG+SVM的短波通信话音检测方法技术

技术编号：34287066 阅读：108 留言：0更新日期：2022-07-27 08:35

本发明专利技术提出了一种基于SVM+HOG的短波通信话音检测方法，可以应用于从短波侦控工作中录制的音频数据中自动检测话音。该方法先基于短波通信音频数据生成语谱图，再从语谱图中提取HOG特征，以HOG特征为输入，使用经过训练的SVM区分噪音和话音，从而达到从短波通信的音频数据中检测出话音的目标。本发明专利技术的话音检测算法具有检测准确率高、模型适应性强等优点。模型适应性强等优点。模型适应性强等优点。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于HOG+SVM的短波通信话音检测方法

[0001]本专利技术涉及短波通信侦控领域，尤其涉及一种话音自动检测方法。

技术介绍

[0002]在短波侦控工作中，经常对已知频率的短波电台进行24小时全时控守，以免漏掉突发重要情况。短波信号经过采集、识别、解调后生成音频数据，再由人工进行筛选和复听。
[0003]为了节省人力，目前多采用自动手段对录音进行检测，筛选出有效话音后再由人工进行听抄。当前主要话音检测方法是设定一个音量门限值，当音频数据的音量超过此门限值时作为话音起点，当音量持续一段时间低于门限值后结束话音提取。
[0004]但是，随着空间频谱环境的恶化，射频频谱变得非常拥挤，信道间相互干扰严重。被控频率通常在没有通话时也掺杂着强烈的噪声和干扰信号，极大降低了当前方法的话音检测准确率。
[0005]目前，工程应用中的改进的话音检测方法是利用话音在单位时间内音量波动幅度大且频繁，不像噪音几乎持续不断且音量变化幅度很小。但是，该改进方法在变化噪音和快速连贯的话音等情况下仍然存在较大的误检率，急需一种...

【技术保护点】

【技术特征摘要】
1.一种基于HOG+SVM的短波通信话音检测方法，其特征在于，包括以下步骤：步骤1，将音频数据分类为话音和噪音并切分成音频片段，以音频片段为基础生成语谱图，再对语谱图进行灰度化预处理；步骤2，将语谱图划分为胞元，以胞元为单位计算每个像素的梯度幅值和梯度方向，统计每个胞元中不同方向上分布的梯度幅值，形成方向梯度直方图，计算图中全部胞元的方向梯度直方图即构成该语谱图的HOG特征；步骤3，以话音语谱图的HOG特征为正向样本，噪音语谱图的HOG特征为负向样本，训练SVM分类器；步骤4，设定检测窗口宽度，以检测窗口为单位，对短波通信录音数据进行扫描，基于窗口内的音频数据生成语谱图，对语谱图进行预处理后提取HOG特征，再将HOG特征输入训练好的SVM分类器进行分类，提取出话音数据。2.根据权利要求1所述的基于HOG+SVM的短波通信话音检测方法，其特征在于，所述步骤1包括：步骤1
‑
1，将短波通信侦控工作中录制的音频数据分类为话音和噪音，其中话音作为训练时的正向样本，噪音作为训练时的负向样本；步骤1
‑
2，按预定的检测窗口和语谱图分辨率要求将话音和噪音数据切分成一个个片段；步骤1
‑
3，基于音频片段，按预定分辨率要求生成语谱图；步骤1
‑
4，对语谱图进行灰度化处理，将图像的三个RGB颜色分量转化为仅有一个分量的灰度值。3.根据权利要求1所述的基于HOG+SVM的短波通信话音检测方法，其特征在于，所述步骤2包括：步骤2
‑
1，按预定的大小将语谱图划分成一个个胞元；步骤2
‑
2，计算...

【专利技术属性】
技术研发人员：白洁，陈路路，李宝莲，张玲，刘伟强，员建厦，陈莉，尹明辉，韩江龙，梁钰萱，杨佳贝，
申请(专利权)人：中国电子科技集团公司第五十四研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人