【技术实现步骤摘要】
本专利技术涉及一种针对具有规律性鼓点节奏的音乐(尤其是古典音乐)内容的乐纹特征提取及表示方法,属于音乐语音信号特征提取及处理
技术介绍
目前在CBMR (Content-based Music Retrieve,基于内容的音乐指纹检索),是CBID (content-based audio identification,基于内容的音频标识)或者说 AFP (Audiofingerprinting,指纹提取)在搜索
中的一个以音乐信号为主要特征的特殊应用。CBMR包括两大主要内容音乐指纹(乐纹)提取和乐纹检索中的匹配算法。在乐纹提取算法方面,到现在为止,国内外已有很多声纹算法的研究成果。广泛采用的方法是从经过短时-傅里叶变换以后的频谱图里面选择一些特征,并对这些特征序列进行建模,建模后的模型提取参数作为该片段的乐纹。在早期的工作中,主要有使用语音信号处理领域的LPC (Linear PredictionCoeff icients,线性预测系数),和使用 MFCC (Mel-Frequency Cepstral Coeff icients,梅尔倒谱系 ...
【技术保护点】
一种对规律性鼓点节奏的音乐进行乐纹特征提取及表示方法,其特征在于:包括对原始音乐的预处理过程、二维乐纹图像生成过程、音乐节奏起点位置提取过程、乐纹特征文件生成过程;具体步骤如下:A、预处理过程如下:步骤A1、采用重叠系数为31/32的平移窗模式对原始音乐文件进行样值序列分帧,得到若干基于时间序列的数据帧;步骤A2、对于A1得到数据帧进行预加重处理,过滤背景噪声和信道白噪声;步骤A3、采用滤波器过滤数据中由于录音设备带来的白噪声以及部门短时高频干扰噪声,得到连续的数据帧;步骤A4,对连续的数据帧进行加载汉宁窗操作,将其转换为时域信号;步骤A5、将步骤A4得到的时域信号采用FF ...
【技术特征摘要】
1.一种对规律性鼓点节奏的音乐进行乐纹特征提取及表示方法,其特征在于:包括对原始音乐的预处理过程、二维乐纹图像生成过程、音乐节奏起点位置提取过程、乐纹特征文件生成过程;具体步骤如下: A、预处理过程如下: 步骤Al、采用重叠系数为31/32的平移窗模式对原始音乐文件进行样值序列分帧,得到若干基于时间序列的数据帧; 步骤A2、对于Al得到数据帧进行预加重处理,过滤背景噪声和信道白噪声; 步骤A3、采用滤波器过滤数据中由于录音设备带来的白噪声以及部门短时高频干扰噪声,得到连续的数据帧; 步骤A4,对连续的数据帧进行加载汉宁窗操作,将其转换为时域信号; 步骤A5、将步骤A4得到的时域信号采用FFT变换变成频域离散信号,即频域矩阵{H(i,j)},并将该频域矩阵{H(i, j)}采用Db格式矩阵E(k)=101og1Q(IH(i,j) |2)换算成相应频点能量矩阵{E(i,j)};其中,H(i,j)为在时间连续i帧坐标下、j频率时短时帧的信号幅度,E(i, j)表示坐标(i, j)对应的频点能量,k代表时间连续巾贞数,1、j、k均为自然数; B、二维乐纹图像生成过程如下: 步骤B1、对步骤A5产生的频点能量矩阵{E(i,j)},采用Bark曲线表进行非线性的Bark子带分离; 步骤B2、对各个子带进行人耳感知门限的过滤,保留人类听觉系统能迅速敏感到的能量点; 步骤B3、对应Bark曲线的非线性...
【专利技术属性】
技术研发人员:林晓勇,蒋玲慧,张跃,赵静,穆祥女,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市: