当前位置: 首页 > 专利查询>西华大学专利>正文

基于隐马尔可夫模型的调频广播信号报时特征识别方法技术

技术编号:15695033 阅读:141 留言:0更新日期:2017-06-24 10:23
本发明专利技术公开基于隐马尔可夫模型的调频广播信号报时特征识别方法,本发明专利技术涉及无线电监测领域,解决根据频谱特征如何识别广播整点报时的新技术问题。本发明专利技术能够仅仅采集多帧整点时段的频谱数据用以训练模型,然后仅需要对整点时刻进行监测即能完成报时特征识别,显著并实质地,降低了数据处理量,加快了“黑广播”自动发现速度;本发明专利技术不受地区和时间的限制,节省人力,有助于提高查找黑广播效率;由于整点报时是区分合法广播与“黑广播”的重要指标之一,因此本发明专利技术可用于减少“黑广播”的频点的查找数量,增加对“黑广播”识别的准确率。

Frequency identification method of FM broadcast signal based on Hidden Markov model

The invention discloses a FM signal based on time feature recognition based on Hidden Markov model, the invention relates to a radio monitoring technology, solve new problems according to the spectral characteristics of how to identify the whole point timekeeping broadcast. The spectral data of the invention can only capture frames, the whole point of time for training model, and then only need to monitor the whole point of time can be completed time feature recognition, and substantially reduced significantly, the amount of data processing, to speed up the speed of automatic discovery of black radio; the invention is not affected by the area and time limit, save manpower, helps to improve the search efficiency of black radio; because the whole point of time is one of the important indicators to distinguish between legitimate and black radio broadcasting, so the invention can be used to reduce the number of frequency points of black radio the search, increase the accuracy of black radio recognition.

【技术实现步骤摘要】
基于隐马尔可夫模型的调频广播信号报时特征识别方法
本专利技术涉及无线电监测领域,具体涉及基于隐马尔可夫模型的调频广播信号报时特征识别方法。
技术介绍
无线电广播是许多地区和人群获得信息的便利途径。然而,一些不法商贩私设电台广播不科学、虚假、低俗的“黑广播”。“黑广播”会干扰正常无线电秩序,侵犯公众合法权益,诱骗科学意识不强的人群(如老年人),甚至可能干扰航空频段引发重大事故。由于“黑广播”是不法商贩的一种违法行为,因此“黑广播”的播放频率、播放时间和播放地点都极具隐蔽性和不确定性,这给实际确定“黑广播”的播放频率、播放时间和播放地点带来极大困难,依靠人工排查不仅费时费力,而且无法及时发现“黑广播”。目前对“黑广播”的查处主要依靠集中整治或投诉等被动方式。本专利技术实现了将报时特征作为合法广播的标志,减少了疑似“黑广播”的频点数量,提高了对“黑广播”自动监测的识别率。广播整点报时是指广播电台在整点通过鸣“嘀”并播报时间的一种报时方式。在文件GBT4961-1999《广播报时信号》和GYT219-2006《广播信号嵌入时间码规范》中对广播报时有着规范的要求。将全国广播电台的报时模式总结为传统报时法、提前报时法和其他报时法。本专利技术根据整点报时是否含“嘀”将报时模式分为传统报时模式和不含“嘀”的报时模式。由于“黑广播”多以录播形式播出,不存在整点报时,而多数合法广播在整点时刻进行报时。因此可通过识别整点报时,识别合法广播,减少“黑广播”的判断数量。通过频段扫描数据的光谱图可观察到各个调频广播的报时模式(见图1)。实际监测过程中可使用频段扫描数据同步分析所有信号。本专利技术用频段扫描数据识别报时特征。在实际监测过程中识别整点报时存在以下难点:1)由于报时模式的多样性,各频点报时开始和结束不同步,报时持续时间长度不同(见图1);2)由于设备原因,在采集过程中数据丢失不可避免,相同时间无法获得相同的频段扫描数据帧数;3)数据采集速度很快(15~40ms一帧数据),如果在数据采集过程中产生偏差会使两个序列产生较大差异;4)相邻的两个信号频点可能对彼此产生干扰。综上所述,包含整点报时的整点时刻频段扫描数据具有以下特点:序列长度不固定;序列之间有错位;序列包含噪声。由于欧式距离对噪声十分敏感,不具备对时间轴伸缩处理的能力,不能很好地处理模式相似性度量。因此,传统的模式匹配方法误差较大。隐马尔可夫模型(HiddenMarkovModel,HMM)是一种统计模型,拥有牢固的统计学基础和训练方法,适合时序建模,可有效处理上述问题中的随机性和不确定性。隐马尔可夫模型是一个双重随机过程,由隐藏的随机过程和观察的随机过程构成。隐藏的随机状态蕴含在观察的随机状态中,通过观察状态概率矩阵和转移概率矩阵,隐藏的随机过程规律可通过观察的随机过程规律发现。隐马尔可夫模型可形式描述为λ=(S,Ω,P,Φ,π),其中,S={si|i=1,…N}为隐藏状态集合,Ω={ok|k=1,…,M}为观察状态集合,P={pij}N×N为隐藏状态转移矩阵,pij表示系统由状态si转移到状态sj(i=1,…,N,j=1,…,N),Φ={φi(ok)}N×M为观察概率矩阵,φi(ok)表示系统处于状态si时产生观察状态ok的概率(i=1,…,N,k=1,…,M),π={πi|i=1,…N}为初始状态概率分布,πi表示初始时si的概率。隐马尔可夫模型已广泛应用于图像处理、人体识别、手写字体识别、文本分类、语音识别、动作识别、经济学、分子生物学等众多研究领域。本专利技术申请将隐马尔可夫模型用于调频广播信号报时特征识别。本专利技术人的在先申请“一种调频广播信号的监测方法(2016103698315)”用于本专利技术的静音数据预处理过程,下面统一以“在先申请”为代词作相关陈述。
技术实现思路
针对上述现有技术,本专利技术目的在于提供基于隐马尔可夫模型的调频广播信号报时特征识别方法,解决根据频谱特征如何识别广播整点报时的新技术问题。为达到上述目的,本专利技术采用的技术方案如下:基于机器学习模型的调频广播信号特征识别方法,包括以下步骤:步骤1、使用信号模板将频谱数据转换为机器码序列;步骤2、定义机器码序列中每个信号的滑动边界、相对滑动边界的重叠边界,在滑动边界和重叠边界内找出信号模板的属性,构建出关于属性的特征向量;步骤3、量化已知类的信号特征为隐藏层,将特征向量作为机器学习模型的输入层,训练出输出层;步骤4、获取实时频谱数据,调用步骤1和步骤2,获得实时特征向量,根据实时特征向量与输出层的匹配特性判断出是否归属已知类的信号特征。基于隐马尔可夫模型的调频广播信号报时特征识别方法,包括以下步骤:步骤1、在广播频段内获取整点时刻邻域内各个调频广播信号预设带宽的数据帧集合,通过静音模板匹配方法,对每个数据帧作静音标记,将该数据帧集合标记为静音数据和剩余数据(非静音数据)的0-1序列,在0-1序列上计算每个滑动区间内的属性,对每个属性进行离散化处理并对离散化处理的结果进行编号,获得编号集,再对编号集进行特征组合(串行融合策略)后,获得第一特征向量;步骤2、将整点时刻邻域内一个完整的整点报时分为若干过程,将若干过程作为隐马尔可夫模型的隐藏状态集合,将步骤1中的编号集作为隐马尔可夫模型的观察状态集合并将第一特征向量作为隐马尔可夫模型观察序列,然后获得初始化或更新的状态转移矩阵、观察概率矩阵和初始概率分布;步骤3、将预先采集的整点报时和不报时两类数据分别作为两个训练集,每个训练集分别作为步骤1的数据帧集合,然后利用隐马尔可夫模型参数学习算法在步骤1和步骤2内构建关于每个训练集的循环迭代训练,在循环迭代训练结束后,,对应两个训练集分别获得报时隐马尔可夫模型和不报时隐马尔可夫模型;步骤4、将实时数据(检测集)作为步骤1的数据帧集合,利用步骤1滑动区间对0-1序列进行统计和离散化处理并进行编号,经过特征组合(串行融合策略)后获得第二特征向量(与第一特征向量中的属性特征相同);步骤5、将第二特征向量分别代入报时隐马尔可夫模型和不报时隐马尔可夫模型,对应获得报时匹配概率和不报时匹配概率,当最大匹配概率等于报时匹配概率时,当前整点时刻信号识别结果为报时。上述方案中,所述的步骤1,在广播频段内获取整点时刻前后数秒到数十秒内各个调频广播信号上预设带宽的数据帧集合。上述方案中,所述步骤1,利用滑动区间对0-1序列进行统计、离散化处理、编号和特征组合(串行融合策略),具体包括以下步骤:步骤①、对调频广播的0-1序列,设置滑动区间和重叠区间的长度;步骤②、对步骤①中的0-1序列从开始至结束,依次统计每一滑动区间内静音持续出现次数以及静音持续长度的平均值、方差和总量;步骤③、将每个滑动区间静音持续出现次数以及静音持续长度的平均值、方差和总量进行离散化处理并对离散化处理的结果进行编号,获得编号集,再对编号集进行特征组合(串行融合策略)后,获得第一特征向量。上述方案中,所述的步骤2,其中:将整点报时分为5个过程:报时前播出的节目(节目1),报时前期(多为停顿),整点报时,报时后期(多为停顿)和报时后播出的节目(节目2),作为5个隐藏状态,构建出隐藏状态集合。上述方案中,所述的步骤2,其中:将第一特征向量作为隐马尔可夫模型中训练集的观察序列本文档来自技高网
...
基于隐马尔可夫模型的调频广播信号报时特征识别方法

【技术保护点】
基于机器学习模型的调频广播信号特征识别方法,其特征在于,包括以下步骤:步骤1、使用信号模板将频谱数据转换为机器码序列;步骤2、定义机器码序列中每个信号的滑动边界、相对滑动边界的重叠边界,在滑动边界和重叠边界内找出信号模板的属性,构建出关于属性的特征向量;步骤3、量化已知类信号的隐藏状态,将特征向量作为机器学习模型的输入层,训练出输出层;步骤4、获取实时频谱数据,调用步骤1和步骤2,获得实时特征向量,根据实时特征向量与输出层的匹配特性判断出是否归属已知类的信号特征。

【技术特征摘要】
1.基于机器学习模型的调频广播信号特征识别方法,其特征在于,包括以下步骤:步骤1、使用信号模板将频谱数据转换为机器码序列;步骤2、定义机器码序列中每个信号的滑动边界、相对滑动边界的重叠边界,在滑动边界和重叠边界内找出信号模板的属性,构建出关于属性的特征向量;步骤3、量化已知类信号的隐藏状态,将特征向量作为机器学习模型的输入层,训练出输出层;步骤4、获取实时频谱数据,调用步骤1和步骤2,获得实时特征向量,根据实时特征向量与输出层的匹配特性判断出是否归属已知类的信号特征。2.基于隐马尔可夫模型的调频广播信号报时特征识别方法,其特征在于,包括以下步骤:步骤1、在广播频段内获取整点时刻邻域内各个调频广播信号预设带宽的数据帧集合,通过静音模板匹配方法,对每个数据帧作静音标记,将该数据帧集合标记为静音数据和剩余数据的0-1序列,在0-1序列上计算每个滑动区间内的属性,对每个属性进行离散化处理并对离散化处理的结果进行编号,获得编号集,再对编号集进行特征组合后,获得第一特征向量;步骤2、将整点时刻邻域内一个完整的整点报时分为若干过程,将若干过程作为隐马尔可夫模型的隐藏状态集合,将步骤1中的编号集作为隐马尔可夫模型的观察状态集合并将第一特征向量作为隐马尔可夫模型观察序列,然后获得初始化或更新的状态转移矩阵、观察概率矩阵和初始概率分布;步骤3、将预先采集的整点报时和不报时两类数据分别作为两个训练集,每个训练集分别作为步骤1的数据帧集合,然后利用隐马尔可夫模型参数学习算法在步骤1和步骤2内构建关于每个训练集的循环迭代训练,在循环迭代训练结束后,对应两个训练集分别获得报时隐马尔可夫模型和不报时隐马尔可夫模型;步骤4、将实时数据作为步骤1的数据帧集合,通过步骤1获得第二特征向量;步骤5、将第二特征向量分别代入报时隐马尔可夫模型和不报时隐马尔可夫模型,对应获得报时匹配概率和不报时匹配概率,当最大匹配概率等于报时匹配概率时,当前整点时刻信号识别结果为报时。3.根据权利要求2所述...

【专利技术属性】
技术研发人员:裴峥刘越智孔明明马方立
申请(专利权)人:西华大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1