一种离线实时多语种广播敏感词监听方法技术

技术编号:24689911 阅读:41 留言:0更新日期:2020-06-27 09:48
本发明专利技术公开了一种离线实时多语种广播敏感词监听方法,包括:对收到的语音信号进行标准化;提取语音filterbanks矩阵作为声学特征;使用卷积神经网络学习不同语种声学特征矩阵,分类识别;采集待识别关键词语音语料,对样本进行大量扩充;对关键词语音样本提取声学特征矩阵,得到关键词声学特征矩阵;使用GRU神经网络学习关键词声学特征;实时提取接收广播语音的声学特征,使用训练好的GRU神经网络进行学习匹配,一旦匹配到目标关键词则告警。本发明专利技术采用离线技术,无需互联网连接;结构简单、代码运行效率高,语音检测效率高。

A method of off-line real-time multilingual broadcast sensitive word monitoring

【技术实现步骤摘要】
一种离线实时多语种广播敏感词监听方法
本专利技术涉及
,具体的说,是一种离线实时多语种广播敏感词监听方法。
技术介绍
随着人工智能技术在语音图像等领域的巨大突破,将人工智能技术成果转化到无线电监测领域的趋势已愈发成熟。在对广播语音进行监测过程中,实时识别语音会话内容,能够对内容中的违法敏感信息进行及时监测和告警有极重大的意义。在边境无线电监测环境中,还需对外文语音及其内容进行识别监测。目前关键词语音识别常用方案有:1.通过语音转文本服务将语音内容转化为文本,从文本中检测关键词文本;2.通过网络语音服务方式将语音数据和敏感词列表上传,服务端分析出敏感词识别结果后返回。以上关键词识别方案的缺点在于:1)语音转文本服务成本高昂;2)语音转文本对硬件有较高要求;3)将语音转为完整文本再从文本中搜寻关键词的方式效率低;4)调用在线网络服务需要稳定的网络连接,无法离线运行。
技术实现思路
本专利技术的目的在于提供一种离线实时多语种广播敏感词监听方法,用于解决现有技术中将关键语音转换成文本再进行检测效率低以及由无法离线运行的问题。<本文档来自技高网...

【技术保护点】
1.一种离线实时多语种广播敏感词监听方法,其特征在于,包括:/n步骤S1:语音识别模块对接收到的广播语音进行语种判别:/n步骤S11:将接收语音进行标准化,转化为语音识别标准语音制式,并提取语音filterbanks矩阵作为声学特征矩阵;/n步骤S12:采用卷积神经网络学习不同语种声学特征矩阵,进行语种识别,并输出语种识别分类结果;/n步骤S2:调用对应语种的关键词语音识别模块进行关键词检测告警:/n步骤S21:采集待识别关键词语音语料,并扩充样本集;/n步骤S22:对关键词语音样本提取声学特征矩阵并进行离散余弦变换,得到非相关的特征矩阵,并只保留前1-13维数据作为新的关键词声学特征矩阵;/...

【技术特征摘要】
1.一种离线实时多语种广播敏感词监听方法,其特征在于,包括:
步骤S1:语音识别模块对接收到的广播语音进行语种判别:
步骤S11:将接收语音进行标准化,转化为语音识别标准语音制式,并提取语音filterbanks矩阵作为声学特征矩阵;
步骤S12:采用卷积神经网络学习不同语种声学特征矩阵,进行语种识别,并输出语种识别分类结果;
步骤S2:调用对应语种的关键词语音识别模块进行关键词检测告警:
步骤S21:采集待识别关键词语音语料,并扩充样本集;
步骤S22:对关键词语音样本提取声学特征矩阵并进行离散余弦变换,得到非相关的特征矩阵,并只保留前1-13维数据作为新的关键词声学特征矩阵;
步骤S23:使用GRU神经网络学习关键词声学特征;
步骤S24:实时提取接收广播语音的13维声学特征,使用训练好的GRU神经网络进行学习匹配,一旦匹配到目标关键词则告警。


2.根据权利要求1所述的一种离线实时多语种广播敏感词监听方法,其特征在于,所述步骤S11中提取声学特征矩阵包括:
步骤S111:对语音信号序列x(t)进行预加强,得到y(t)=x(t)-0.97x(t-1);
步骤S112:将预加强后的语音切割为时间上有重叠的帧,并对每个帧执行hamming窗函数;
步骤S113:对每一帧执行256点的FFT变换,将时域帧转换为频域;
步骤S114:对每一个频谱均采用多个三角滤波器进行滤波,其中三角滤波器间的间隔符合梅尔尺度,并将滤波后的频谱进行合并;
步骤S115:将合并后的频谱归一化处理得到FilterBanks矩阵。

【专利技术属性】
技术研发人员:吕志良陈曾莫舸舸
申请(专利权)人:成都华日通讯技术股份有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1