当前位置: 首页 > 专利查询>西华大学专利>正文

基于语音识别技术的广播保障方法技术

技术编号:13974159 阅读:55 留言:0更新日期:2016-11-11 03:20
基于语音识别技术的广播保障方法,本发明专利技术涉及违规广播监测技术领域,其旨在解决现有“黑广播”发现多依赖于人工监测或民众投诉,监测手段效率低下、查处滞后的问题。该方法通过频段扫描,发现广播频段中的信号频点,并依次对相应信号进行中频监测和录音监听,得到信号音频数据,然后对音频数据进行切割、分类,提取语音音频数据,通过语音识别技术将广播语音转换为文本,根据关键词库检索识别后的文本,根据检索结果判断该信号是否为“黑广播”,重复此过程实现了业务流程和“黑广播”发现的自动化。

【技术实现步骤摘要】

本专利技术涉及违规广播监测
,具体涉及基于语音识别技术的广播保障方法
技术介绍
“黑广播”,就是未经广播电视管理部门和无线电管理机构批准、擅自设置并利用广播频率向社会进行播音宣传的广播电台(违规广播)。2013年国家开始对药品广告进行了严格管理,通过建立黑广播大范围播放违规广告的现象越来越严重。擅自设置的黑广播电台使用的都是质量低劣、功率大的发射机,存在严重的安全隐患,主要表现在以下几个方面:1.黑广播主要播放虚假医药广告,具有很强的诱惑性,欺骗听众购买非法销售药品。并且黑广播广告内容低俗,容易对未成年人造成不利影响;2.黑广播强占频率资源,容易干扰正常广播的播出,同时黑广播发射设备质量低劣,容易干扰民航通信,使飞机与管制员无法建立联系,威胁民航安全;3.黑广播设备一般设置在居民小区内,发射功率较大,容易污染周边的电磁环境,损害居民身体健康。2015年6月,建立的打击治理电信网络新型违法犯罪工作部际联席会议,第一次会议上,决定从2015年11月1日至2016年4月30日在全国范围内开展打击治理电信网络新型违法犯罪专项行动,并明确将黑广播违法犯罪活动作为重点打击对象之一。2016年4月9日晚的新闻联播节目,专门播报了针对黑广播的专项行动。报道称自2016年2月15日打击黑广播专项行动开展以来,全国公安机关与相关部门捣毁黑广播窝点435个,查扣黑广播设备567台,查处违法犯罪人员188名。黑广播之所以屡禁不止,因为背后有着庞大的利益链条。而一套黑广播发送设备的价格才几万元,相比之下,非常便宜,而且可以远程操控、无人值守,方便犯罪分子逃脱。巨大的收益与低廉的成本代价造成了目前黑广播屡禁不止的现象。在黑广播的查处过程中,广播频点的发现困难。目前,黑广播频点的发现主要还是依靠人工逐个对频点监听实现的,消耗了工作人员大量的时间和精力,或 者由听众、航空部门(黑电台有时会干扰民航通信)等发现并举报,传达到无线电管理部门,造成了黑广播查处的被动和滞后。因此,根据“黑广播”播放内容确认其类型和对应频道,对打击黑广播犯罪、保障广播安全、维护空中电磁环境具有重大意义。由于广播音频时段过长,一般是连续十几个小时甚至是24小时不间断播放;并且广播音频内容丰富,往往包含大量对语音识别无效的音乐部分。因此,在语音识别之前,需要采用科学的方法实现对广播音频的分割与分类,得到满足语音识别条件的语音音频数据,来提升语音识别系统效率。因此,本专利技术在广播监测业务流程自动化的基础上,率先提供一种先分割、分类再合并的音频处理方法通过内容识别与检索来解决“黑广播”识别问题。
技术实现思路
针对上述现有技术,本专利技术目的在于提供基于语音识别技术的广播保障方法,通过频段扫描,发现广播频段中的信号频点,并依次对相应信号进行中频监测和录音监听,得到信号音频数据,然后对音频数据进行切割、分类,提取语音音频数据,通过语音识别技术将广播语音转换为文本,根据关键词库检索识别后的文本,根据检索结果判断该信号是否为“黑广播”,重复此过程实现了业务流程和“黑广播”发现的自动化,提升了“黑广播”发现效率。为达到上述目的,本专利技术采用的技术方案如下:基于语音识别技术的广播保障方法,包括步骤,如图1:步骤1、获取广播频段内具有信号的所有广播频率;步骤2、对具有信号的广播频率依次进行中频测量与录音监听,获得音频数据;步骤3、对获取的音频数据进行切割,然后对切割后的音频数据段进行分类,获得语音音频数据段、音乐音频数据段和静音音频数据段;步骤4、对语音音频数据段进行合并,得到连续的语音音频数据;步骤5、将连续的语音音频数据通过语音识别系统转换成文本,再对文本进行黑广播关键词检索,从而判断出广播类型和对应频率;步骤6、对上述5个步骤进行轮询,实现实时自动监测。上述方法中,所述的步骤3,其步骤包括步骤3.1、采用端点检测分割方法,设置门限值与静音段长度完成音频数据切割,并剔除其中的静音音频数据段;步骤3.2、根据切割后音频段的语音有效段比例和静音比例,求出分类因子值;步骤3.3、根据分类因子值,判断出切割后音频段的类型完成音频数据分类。上述方法中,所述的步骤3.1,其短时平均能量E取为 E n = Σ m = 1 N | x n ( m ) | ]]>其中,En表示第n帧的短时平均能量,xn(m)表示音频帧的第m个采样点的值,N表示一帧内采样点的个数;短时平均能量En可以用来判断静音帧。如果某一帧的En小于阈值,则认为该帧是静音帧,否则是非静音帧;同时,短时平均能量En是区分音乐和静音的有效特征;语音中含有比音乐中更多的静音部分,因而,语音的短时平均能量与门限的交叉部分要比音乐中的多很多。上述方法中,所述的步骤3.1,对整段音频数据进行查找,找出满足信号强度和时间长度要求的音频段,对整段音频进行分帧加窗,求短时平均能量E及短时平均能量均值Ea,并计算出查找音频段的短时平均能量均值Eaver。本专利技术将信号强度低于0.2、时间长度大于0.3秒作为要求条件。图2所示为满足要求条件的音频段查找结果,原音频类型包括无背景音乐的语音音频、带背景音乐的语音音频和音乐音频(普通音乐音频与强音乐音频)。所述的步骤3.1,根据无背景音乐的语音音频、带背景音乐的语音音频和音乐音频三种音频类型设置门限值,具体包括无背景音乐的语音音频,仅含背景噪声的语音,满足条件的音频段即可视为静音段,该音频段的短时平均能量均值Eaver过小,为避免低门限值过低对分类方法产生的影响,其低门限值取max(Eaver,Ea/4);带背景音乐的语音音频,整段语音信号的强度相对于增加了幅度的无背景音乐语音音频,短时平均能量增大,由于背景音乐强度有高有低,所查找的音频段的短时平均能量均值Eaver,即可看作静音段短时平均能量做了小额的提升,其低 门限值取Eaver;音乐音频,一般是连续的,没有静音段。若能查找到满足条件的音频段,则其短时平均能量均值Eaver较大,分割时会把音频段中能量较低的部分划分到低门限以下,为避免门限值过大对分割分类造成的影响,其低门限值取min(Eaver,Ea/3);连续且强度较高的音乐信号强度整体偏高,不存在静音段,无法找到满足条件的音频段,音乐段不需要进行分割和语音识别,不用处理。上述方法中,所述的步骤3.1,其低门限值设置为Tmin=min(max(Eaver,Ea/4),Ea/3);高门限值设置为Tmax=2×Tmin;静音段长度为0.2秒,基于语言特征设置,高于0.2秒存在分割段过长问题,降低分类灵敏度,低于0.2秒分割过于细碎。上述方法中,所述的步骤3.2,其语音有效段比例Rvs定义为Rvs=Cvs/t其中,Cvs表示该段音频语音有效段总数,t表示该段音频时长,指仅端点帧短时能量小于阈值中间帧均大于阈值且长度大于0.2秒的语音段,语音有效段比例,指每秒钟的语音有效段数,它与广播每秒播报的字数有关,在广播中,一般来说,字与字之间的本文档来自技高网
...

【技术保护点】
基于语音识别技术的广播保障方法,其特征在于,包括步骤:步骤1、获取广播频段内具有信号的所有广播频率;步骤2、对具有信号的广播频率依次进行中频测量、录音监听,获得音频数据;步骤3、对获取的音频数据进行切割,然后对切割后的音频数据段进行分类,获得语音音频数据段、音乐音频数据段和静音音频数据段;步骤4、对语音音频数据段进行合并,得到连续的语音音频数据;步骤5、将连续的语音音频数据通过语音识别系统转换成文本,再对文本进行黑广播关键词检索,从而判断出广播类型和对应的广播频率;步骤6、对上述5个步骤进行轮询,实现实时自动监测。

【技术特征摘要】
1.基于语音识别技术的广播保障方法,其特征在于,包括步骤:步骤1、获取广播频段内具有信号的所有广播频率;步骤2、对具有信号的广播频率依次进行中频测量、录音监听,获得音频数据;步骤3、对获取的音频数据进行切割,然后对切割后的音频数据段进行分类,获得语音音频数据段、音乐音频数据段和静音音频数据段;步骤4、对语音音频数据段进行合并,得到连续的语音音频数据;步骤5、将连续的语音音频数据通过语音识别系统转换成文本,再对文本进行黑广播关键词检索,从而判断出广播类型和对应的广播频率;步骤6、对上述5个步骤进行轮询,实现实时自动监测。2.根据权利要求1所述的基于语音识别技术的广播保障方法,其特征在于,所述的步骤3,其步骤包括步骤3.1、采用端点检测分割方法,设置门限值与静音段长度完成音频数据切割,并剔除其中的静音音频数据段;步骤3.2、根据切割后音频数据段的语音有效段比例和静音比例,求出分类因子值;步骤3.3、根据分类因子值,判断出切割后音频数据段的类型完成音频数据分类。3.根据权利要求2所述的基于语音识别技术的广播保障方法,其特征在于,所述的步骤3.1,对获得的音频数据进行整段查找,找出满足音频信号强度和时间长度要求的音频数据段,再对整段音频数据进行分帧加窗,求短时平均能量E及短时平均能量均值Ea,并计算出所查找到的音频数据段的短时平均能量均值Eaver作为计算门限值的依据;短时平均能量E取为 E n = Σ m = 1 N | x n ( m ) | ]]>其中,En表示第n帧的短时...

【专利技术属性】
技术研发人员:刘晶杨东沿孔明明裴峥
申请(专利权)人:西华大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1