【技术实现步骤摘要】
本专利技术属于音频信号处理领域,特别涉及一种基于分层可靠度变化趋势的音频分割方法。
技术介绍
近年来,在信号处理领域中,对信号的分割处理方面,基于内容的音频信号分割,也称跳变点检测,是指利用连续音频信号流在发生转变时听觉特征之间存在差异的现象将音频分为若干片段,每个片段在内容上具有一致性或在声学特征上具有相似性。目前基于内容的音频信号分割方法主要分为基于距离、基于模型、基于模型选择的分割方法3类。其中,基于距离的分割方法是利用相邻窗的样本间的距离来度量相邻音频段的相似性,它具有计算简单的特点,但是该方法在选择候选分割点的时候需要事先设定门限值,并且当门限值较小时,易检测出冗余分割点,而当门限值较大时,会导致分割点漏检,并且对声学特征的改变比较敏感。基于模型的分割方法不需要对阈值的界定,它是使用训练好的模型来分割音频流,但是生成这个模型需要事先采集样本,反复训练,计算代价过高且适应性差。基于模型选择的方法是一种假设检验的方法,它使用贝叶斯信息准则(Bayesianinformationcriterion,BIC)作为模型的选择标准,具有无门限、鲁棒等优点, ...
【技术保护点】
一种基于分层可靠度变化趋势的音频分割方法,其特征在于,包括以下步骤:1)定长分析窗内基于可靠度变化趋势的分层跳变点检测;假设每次分析窗内只有一个跳变点,然后计算窗口内各帧的可靠度,根据可靠度的变化趋势来检测分析窗内是否有跳变点;2)基于定长分析窗内跳变点检测的音频分割;对整个音频信号特征序列从起始位置加定长分析窗W0,若没有检测到跳变点,窗口向后移动Δl距离,0<Δl<Nmin,Nmin为最小窗口Wm的长度;继续检测下一区域距离;若检测到跳变点,得到一个定长分析窗内以显著度排序的跳变点的序列;将分析窗W0移至具有最大时间上标的跳变点处,继续检测下一区域;当定长分析窗遍历整个 ...
【技术特征摘要】
1.一种基于分层可靠度变化趋势的音频分割方法,其特征在于,包括以下步骤:1)定长分析窗内基于可靠度变化趋势的分层跳变点检测;假设每次分析窗内只有一个跳变点,然后计算窗口内各帧的可靠度,根据可靠度的变化趋势来检测分析窗内是否有跳变点;2)基于定长分析窗内跳变点检测的音频分割;对整个音频信号特征序列从起始位置加定长分析窗W0,若没有检测到跳变点,窗口向后移动Δl距离,0<Δl<Nmin,Nmin为最小窗口Wm的长度;继续检测下一区域距离;若检测到跳变点,得到一个定长分析窗内以显著度排序的跳变点的序列;将分析窗W0移至具有最大时间上标的跳变点处,继续检测下一区域;当定长分析窗遍历整个歌曲音频流后,将会得到所有的跳变点的集合CP;然后再将跳变点的集合CP重新按照时间排序,完成对整个音频流的分割。2.根据权利要求1所述的一种基于分层可靠度变化趋势的音频分割方法,其特征在于,可靠度的变化趋势是指:在跳变点xk左侧,随着音频帧靠近跳变点xk时,可靠度值呈上升趋势,在跳变点xk右侧,随着音频帧远离跳变点xk时,可靠度值呈下降趋势,而在跳变点xk处,RE(xk)将取得极大值。3.根据权利要求1所述的一种基于分层可靠度变化趋势的音频分割方法,其特征在于,检测分析窗内是否有跳变点具体步骤为:若未检测到跳变点,表明该窗口中不含跳变点;若检测到跳变点SP1,则以SP1为界,将W0切分为两个子窗W1与W2,然后再按照上述流程检测子窗W1与W2中是否包含跳变点,若未检测到跳变点,则不再切分窗口,认为其中不包含跳变点;若检测到跳变点,则以跳变点为界将子窗一分为二继续检测下一层子窗,直至子窗长度小于最小窗口长度Nmin或子...
【专利技术属性】
技术研发人员:杨新宇,王银瑞,丁建行,董怡卓,罗晶,杨泽正,王艺蒙,李雨墨,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。