基于声音线性预测倒谱系数的工程机械的识别方法技术

技术编号:12420610 阅读:138 留言:0更新日期:2015-12-02 15:45
本发明专利技术提供了一种基于声音线性预测倒谱系数的工程机械识别方法,包含以下步骤:在施工现场真实环境下采集背景噪音信号;将工程机械置于理想环境下,启动工程机械;声音采集装置采集工程机械发出的声音信号;声音信号进行端点检测、加窗、分帧,端点检测通过过零率来实现,采用汉明窗对信号进行分帧;对分帧后的每帧信号提取LPCC;采用支持向量机建立工程机械声音特征指纹库;对实时声音信号提取LPCC后采用支持向量机与特征指纹库进行匹配,实现分类。

【技术实现步骤摘要】

本专利技术涉及声音识别
,具体的说,是涉及一种基于声音线性预测倒谱系 数的工程机械识别方法。
技术介绍
由于用地紧张、市容建设等原因,城市输电大部分采用铺设电缆的形式,与架空电 缆相比,地下电缆输电具有占地面积小、抗干扰能力强、有利于市容美化等优点。然而,由于 存在大量不规范的道路施工工程作业,使得地下电缆遭到工程机械破坏,影响供电系统的 稳定性同时也会对人民生活和工业生产带来巨大不便。在道路施工过程中,极易造成地下 电缆被破坏的工程机械主要有机械冲击锤、切割机、手持式电镐等。通过采集工程机械在作 业时产生的声音信号并进行智能识别能有效地在电缆被破坏之前发出警报,从而辅助电力 公司及时采取相关措施以防止电缆被破坏。 地下电缆经常受到工程机械的破坏,而目前又没有专门针对工程机械的识别方 法,因此,本专利技术提出了一种通过提取工程机械声音特征来识别工程机械的方法。
技术实现思路
针对上述现有技术中的不足,本专利技术提供一种的基于声音线性预测倒谱系数的工 程机械识别方法。 本专利技术所采取的技术方案是: -种基于声音线性预测倒谱系数的工程机械识别方法,包括如下步骤: 利用理想环境下提取的工程机械LPCC系数构建工程机械声音特征指纹库; 工程机械实时声音信号提取LPCC系数建立; 对工程机械每帧信号的LPCC系数依据其所属的声源进行类标标定; 利用支持向量机学习算法,采用标定后工程机械每帧信号的LPCC工程机械声音 特征指纹库进行模型训练学习,建立分类模型; 将工程机械实时声音信号提取每帧信号的LPCC特征,输入到支持向量机学习算 法已训练好的分类模型中,依据已构建的分类器函数,计算该帧实测信号的输出值,即采用 前述训练数据得到的拟合函数,计算实测信号LPCC特征的函数输出,所得到的向量中最大 元的位置即为工程器械的类型。 利用理想环境下提取的工程机械LPCC系数构建工程机械声音特征指纹库包括: 工程机械声音信号提取LPCC系数建立; 背景噪音信号提取LPCC系数建立; 工程机械声音信号提取LPCC系数建立包括: 将工程机械置于理想环境下,启动工程机械; 声音采集装置采集工程机械发出的声音信号; 工程机械声音信号预处理; 对工程机械声音信号进行分帧; 对分帧后的每帧工程机械声音信号提取LPCC系数。 工程机械声音信号预处理包括:工程机械声音信号进行端点检测、加窗、分帧。 工程机械声音信号端点检测通过过零率来实现。 采用汉明窗对工程机械声音信号进行分帧。 背景噪音信号提取LPCC系数建立包括: 在施工现场真实环境下采集背景噪音信号; 背景噪音信号预处理; 对背景噪音信号进行分帧; 对分帧后的每帧背景噪音信号提取LPCC系数。 背景噪音信号预处理包括:背景噪音信号进行端点检测、加窗、分帧。 背景噪音信号端点检测通过过零率来实现。 采用汉明窗对背景噪音信号进行分帧。 工程机械实时声音信号提取LPCC系数建立包括: 声音采集装置采集工程机械实时声音信号; 工程机械实时声音信号预处理; 对工程机械实时声音信号进行分帧; 对分帧后的每帧工程机械实时声音信号提取LPCC系数。 工程机械实时声音信号预处理包括:工程机械实时声音信号进行端点检测、加窗、 分帧。 工程机械实时声音信号端点检测通过过零率来实现。 采用汉明窗对工程机械实时声音信号进行分帧。 所述背景噪音信号为黄沙车的声音、人的说话声以及工地工程机械工作时的发出 的声音信号。 所述工程机械包括:电镐、切割机、挖掘机和机械冲击锤。 所述采集距装置与工程机械的距离,包括近、中、远三种距离。 所述采集距装置与电镐、切割机、挖掘机的近距离为10米;中距离为30米;远距 离为50米。 所述采集距装置与机械冲击锤的近距离为50米;中距离为100米;远距离为150 米。 工程机械发出的声音信号每帧选取1024个米样点,帧移为512个米样点。 所述声音采集装置为十字声阵列。 所述十字声阵列采集声音的时间间隔为0. 5秒。 所述LPCC特征的提取方法为: 首先求得每帧信号的LPC值,进而求得其LPCC值; 采用 Levinson-Durbin 算法求解 LPC 值; LPC为线性预测系数,用过去的声音信号采样点的值来预测现在或未来的声音信 号采样点的值,即第η点的声音信号的值s (η)能够通过前p点的值的线性组合进行预测, 如公式1所示: s (η)~ap (n_l)+a2s (n_2)+...+aps (n_p) (I) 其中&1,a2,…ap是线性预测系数(LPC),p为LPC阶数,这里取16 Levinson-Durbin算法通过使实际音频信号的采样值与线性预测采样值之间均方 差(公式⑵)最小,即可得到P阶线性预测系数&1,&2,…ap。 线性预测系数得到后,可得到发声系统传递函数模型: LPCC是LPC在倒谱域中的表示,倒谱系数就是利用同态处理方法,对声音信号求Z 变换后取对数,再求反Z变换就可得到倒谱系数。在获得线性预测系数后,得到系统模型, 设冲击响应为c (η),由倒谱定义可得: 将⑶代入(4),并对ζ 1求偏导数,得到(5): 令(5)左右两边相应系数相等,得到(6): 其中,C1, C2,…c^LPCC 值,η 为 LPCC 阶数,这里取 η = 18。 所述工程机械声音特征指纹库建立方法如下: 对每帧信号提取出的18阶LPCC值,在前面加入一列作为类标,标号'0'代表手持 电镐、'1'代表噪声、'2'代表切割机、'3'代表机械冲击锤,'4'代表挖掘机。从而构成一 个19阶的特征向量; 用Iibsvm作为分类器,选取径向基核函数(RBF)作为分类器核函数;RBF有两个 参数:惩罚因子c以及参数gamma,可以通过Iibsvm的网格搜索函数opti_svm_coeff选取 数值;从而使得选取的RBF核函数能够有效的将数据映射到高维空间,并在高维空间中将 各类标定的工程器械信号按类标转换成不同的高维信号; 训练过程使用Svmtrain函数,包含四个参数:特征向量,用上述提取出的有标号 的LPCC值;核函数类型,选用RBF核函数;RBF核函数参数c和gamma,使用网格搜索法确 定;调用svmtrain后会得到一个名为model的变量,这一变量保存了训练所得模型信息,将 这一变量保存下来供下一步识别用; 将每帧信号得到的LPCC值用Iibsvm的svmtest函数进行智能分类; svmtest有三个参数,第一个为类标,用来测试识别率用的,这里取LPCC值的第一 列,第二个为特征向量,即存储LPCC值的变量,第三个为匹配模型,就是上述步骤训练过程 所得到的变量model ; 调用svmtest得到的返回值就是分类所得结果,即类标,从而能确定产生这一声 音的设备类型。 本专利技术相对现有技术的有益效果: 本专利技术能够提高识别效果并减少误警率,能够有效地识别手持电镐、切割机、机械 冲击锤、挖掘机四类设备。现有地下电缆防外力破坏多采用振动或光纤信号进行检测,本发 明采用声音,检测距离更远,对手持电镐、切割机、挖掘机有效检测距离能达到60m、机械冲 击锤有效检测距离能达到180m,识别率能达到80%以上。【附图说明】 图1是按照本专利技术的基于声音线本文档来自技高网...

【技术保护点】
一种基于声音线性预测倒谱系数的工程机械识别方法,包括如下步骤:利用理想环境下提取的工程机械LPCC系数构建工程机械声音特征指纹库;工程机械实时声音信号提取LPCC系数建立;对工程机械每帧信号的LPCC系数依据其所属的声源进行类标标定;利用支持向量机学习算法,采用标定后工程机械每帧信号的LPCC工程机械声音特征指纹库进行模型训练学习,建立分类模型;将工程机械实时声音信号提取每帧信号的LPCC特征,输入到支持向量机学习算法已训练好的分类模型中,依据已构建的分类器函数,计算该帧实测信号的输出值,即采用前述训练数据得到的拟合函数,计算实测信号LPCC特征的函数输出,所得到的向量中最大元的位置即为工程器械的类型。

【技术特征摘要】

【专利技术属性】
技术研发人员:曹九稳杨三伟王建中王瑞荣赵伟杰吴成才
申请(专利权)人:浙江图维电力科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利