对规律性鼓点节奏的音乐进行乐纹特征提取及表示方法技术

技术编号：8656478 阅读：628 留言：1更新日期：2013-05-02 00:13

本发明专利技术公开了一种对规律性鼓点节奏的音乐进行乐纹特征提取及表示方法。针对具有规律性鼓点节奏的音乐进行音乐小节的参数提取和估计并生成小节位置偏移矩阵，对音乐内容中提取符合人体感知的必备参数，通过非线性的Bark子带分离，获得各子带的能量参数矩阵，矩阵内部以块形式进行交织做差，最终判决输出为二维乐纹图像，将小节位置偏移矩阵与二维乐纹图像生成一个独立的可表示的特定的“乐纹”文件。本发明专利技术主要针对鼓点较为清晰的古典音乐（正版）提取其特定“乐纹”，作为音乐自身的独立“指纹”，同时也可以提取翻版古典音乐（盗版、盗录、翻录）的乐纹信息，并进行比对，最终通过误差判决是否为正版音乐。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种针对具有规律性鼓点节奏的音乐(尤其是古典音乐)内容的乐纹特征提取及表示方法，属于音乐语音信号特征提取及处理

技术介绍
目前在CBMR (Content-based Music Retrieve,基于内容的音乐指纹检索)，是CBID (content-based audio identification,基于内容的音频标识)或者说 AFP (Audiofingerprinting,指纹提取)在搜索
中的一个以音乐信号为主要特征的特殊应用。CBMR包括两大主要内容音乐指纹(乐纹)提取和乐纹检索中的匹配算法。在乐纹提取算法方面，到现在为止，国内外已有很多声纹算法的研究成果。广泛采用的方法是从经过短时-傅里叶变换以后的频谱图里面选择一些特征，并对这些特征序列进行建模，建模后的模型提取参数作为该片段的乐纹。在早期的工作中，主要有使用语音信号处理领域的LPC (Linear PredictionCoeff icients,线性预测系数)，和使用 MFCC (Mel-Frequency Cepstral Coeff icients,梅尔倒谱系数)特征来表征音乐信号。二者都是将声音信号变换到倒谱域上，MFCC方法比LPC相比具有较好优势。由于当前研究的“声纹”检索技术主要是针对泛声音类，比如语音段落、歌曲、音乐歌曲等，因此采用的手段都比较通用及广泛，在鲁棒性上性能较差。而对于全球越来越高的保护知识产权的古典音乐来说，并不具有一般性。古典音乐的旋律优美，鼓点较为规律(t匕如钢琴、古筝等键击类音乐)，如何对此类具有规律性鼓点节奏的音乐进行“...

【技术保护点】
一种对规律性鼓点节奏的音乐进行乐纹特征提取及表示方法，其特征在于：包括对原始音乐的预处理过程、二维乐纹图像生成过程、音乐节奏起点位置提取过程、乐纹特征文件生成过程；具体步骤如下：A、预处理过程如下：步骤A1、采用重叠系数为31/32的平移窗模式对原始音乐文件进行样值序列分帧，得到若干基于时间序列的数据帧；步骤A2、对于A1得到数据帧进行预加重处理，过滤背景噪声和信道白噪声；步骤A3、采用滤波器过滤数据中由于录音设备带来的白噪声以及部门短时高频干扰噪声，得到连续的数据帧；步骤A4,对连续的数据帧进行加载汉宁窗操作，将其转换为时域信号；步骤A5、将步骤A4得到的时域信号采用FFT变换变成频域离散信号，即频域矩阵{H(i,j)}，并将该频域矩阵{H(i,j)}采用Db格式矩阵E(k)=10log10(|H(i,j)|2)换算成相应频点能量矩阵{E(i,j)}；其中，H(i,j)为在时间连续i帧坐标下、j频率时短时帧的信号幅度，E(i,j)表示坐标（i,j）对应的频点能量，k代表时间连续帧数，i、j、k均为自然数；B、二维乐纹图像生成过程如下：步骤B1、对步骤A5产生的频点能量矩阵{E(i,j...

【技术特征摘要】
1.一种对规律性鼓点节奏的音乐进行乐纹特征提取及表示方法，其特征在于:包括对原始音乐的预处理过程、二维乐纹图像生成过程、音乐节奏起点位置提取过程、乐纹特征文件生成过程；具体步骤如下: A、预处理过程如下: 步骤Al、采用重叠系数为31/32的平移窗模式对原始音乐文件进行样值序列分帧，得到若干基于时间序列的数据帧；步骤A2、对于Al得到数据帧进行预加重处理，过滤背景噪声和信道白噪声；步骤A3、采用滤波器过滤数据中由于录音设备带来的白噪声以及部门短时高频干扰噪声，得到连续的数据帧；步骤A4，对连续的数据帧进行加载汉宁窗操作，将其转换为时域信号；步骤A5、将步骤A4得到的时域信号采用FFT变换变成频域离散信号，即频域矩阵{H(i，j)}，并将该频域矩阵{H(i, j)}采用Db格式矩阵E(k)=101og1Q(IH(i，j) |2)换算成相应频点能量矩阵{E(i，j)};其中，H(i，j)为在时间连续i帧坐标下、j频率时短时帧的信号幅度，E(i, j)表示坐标(i, j)对应的频点能量，k代表时间连续巾贞数，1、j、k均为自然数； B、二维乐纹图像生成过程如下: 步骤B1、对步骤A5产生的频点能量矩阵{E(i，j)}，采用Bark曲线表进行非线性的Bark子带分离；步骤B2、对各个子带进行人耳感知门限的过滤，保留人类听觉系统能迅速敏感到的能量点；步骤B3、对应Bark曲线的非线性...

【专利技术属性】
技术研发人员：林晓勇，蒋玲慧，张跃，赵静，穆祥女，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人