一种基于作业现场的音频数据结构化转化方法技术

技术编号:30435936 阅读:23 留言:0更新日期:2021-10-24 17:36
本发明专利技术公开了一种基于作业现场的音频数据结构化转化方法,涉及音频数据技术领域,解决现有音频分析产品精度差的技术问题,方法包括:获取电力作业现场环境中的原始音频;利用梅尔倒谱系数MFCC对原始音频进行特征提取得到MFCC特征;利用入狄利克雷过程高斯混合模型DPGMM对原始音频进行处理得到DPGMM后验图;将DPGMM后验图与MFCC特征连接起来作为原始音频的音频结构化的增强特征,并得到语音文本;利用Catboost算法对语音文本进行多标签分类得到多标签分类信息;将多标签分类信息存入数据库,以方便后续的关键字检索以及更深入的音频分析。本发明专利技术通过MFCC

【技术实现步骤摘要】
一种基于作业现场的音频数据结构化转化方法


[0001]本专利技术涉及音频数据
,更具体地说,它涉及一种基于作业现场的音频数据结构化转化方法。

技术介绍

[0002]在电力行业中,随着能源互联网、智能电网、泛在电力物联网的建设和发展,各种网络拓扑变得更加复杂。特别在电力作业现场智能化监控上,现场语音等音频数据被广泛地进行采集,因此也产生了海量的音频数据。但目前电力作业现场的音频采集分析系统仅实现了数据采集,海量音频需要耗费大量的人工来进行处理和分析,同时存在无法智能音频数据挖掘、无法有效表达与管理和高效检索等弊病。如何提取音频中的结构化信息和内容语义是音频信息深度处理、基于内容的音频检索以及辅助视频分析等应用的关键。
[0003]现有技术的缺陷和不足:
[0004]电力作业现场的音频数据主要以语音数据为主,所以作业现场音频数据的结构化也应该以语音内容为基础。虽然近几年出现了一些基于音频智能分析产品作为人工筛查分析的有力补充,但缺乏大规模应用的标准,分析精度差,作用十分有限。

技术实现思路

[0005]本专利技本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于作业现场的音频数据结构化转化方法,其特征在于,包括:获取电力作业现场环境中的原始音频;利用梅尔倒谱系数(MFCC)对所述原始音频进行特征提取得到MFCC特征;利用入狄利克雷过程高斯混合模型(DPGMM)对所述原始音频进行处理得到DPGMM后验图;将所述DPGMM后验图与MFCC特征连接起来作为所述原始音频的音频结构化的增强特征,并得到语音文本;利用Catboost算法对所述语音文本进行多标签分类得到多标签分类信息;将所述多标签分类信息存入数据库,以方便后续的关键字检索以及更深入的音频分析。2.根据权利要求1所述的一种基于作业现场的音频数据结构化转化方法,其特征在于,在所述入狄利克雷过程高斯混合模型中采用无限高斯混合模型(GMM):其中,p(x
i

k
,∑
k
)为高斯分布的概率密度函数,π
k
为对应高斯分布的混合权重参数,权重值为正数,上式可以写成:采用折棍子模型(Stick Breaking)对混合权重进行采样取值,对高斯分布的均值和方差取自正态



Wishart(NIW)分布NIW(μ0,λ,∑0,v);其中,均值置信度为μ0、方差置信度为∑0、均值置信度系数为λ和方差置信度为系数v;通过混合权重对高斯聚类指标隐藏变量Z
i
进行采样,通过Z
i
指示的高斯聚类对每个数据点X
i
进行采样;所述入狄利克雷过程高斯混...

【专利技术属性】
技术研发人员:王天师李华刘文韬罗其锋张春梅谭伟谭莹莹包达志魏俊锋黄国柱
申请(专利权)人:广东电网有限责任公司中山供电局
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1