当前位置: 首页 > 专利查询>索尼公司专利>正文

音乐信号处理设备和方法技术

技术编号:10634758 阅读:88 留言:0更新日期:2014-11-12 10:39
本发明专利技术提供了一种音乐信号处理设备和方法、以及程序,该音乐信号处理设备包括频谱变换单元、滤波器、频率特征量生成单元以及旋律特征量序列获取单元。频谱变换单元被配置为将音乐信号变换成频谱,该音乐信号是包含具有旋律的部分的音乐作品的信号。滤波器被配置为去除频谱的陡峭峰。频率特征量生成单元被配置为根据从滤波器输出的信号生成所述部分的基频分量得到强调的频率特征量。旋律特征量序列获取单元被配置为基于频率特征量来获取旋律特征量序列,该旋律特征量序列指定所述部分在每个时间处的基频。

【技术实现步骤摘要】
【专利摘要】本专利技术提供了一种音乐信号处理设备和方法、以及程序,该音乐信号处理设备包括频谱变换单元、滤波器、频率特征量生成单元以及旋律特征量序列获取单元。频谱变换单元被配置为将音乐信号变换成频谱,该音乐信号是包含具有旋律的部分的音乐作品的信号。滤波器被配置为去除频谱的陡峭峰。频率特征量生成单元被配置为根据从滤波器输出的信号生成所述部分的基频分量得到强调的频率特征量。旋律特征量序列获取单元被配置为基于频率特征量来获取旋律特征量序列,该旋律特征量序列指定所述部分在每个时间处的基频。【专利说明】音乐信号处理设备和方法、以及程序 相关申请的交叉引用 本申请要求2013年5月9日提交的日本优先权专利申请JP2013-099654的权益, 其全部内容通过引用结合于此。
本公开内容涉及一种音乐信号处理设备和方法、以及程序,并且更具体地涉及能 够在不增加处理负荷的情况下精确地提取歌声的音乐信号处理设备和方法、以及程序。
技术介绍
近年来,对于从许多音乐作品(musical piece)中搜索与歌声相关的旋律的要求 日益增加。例如,执行基于用户的歌声或哼唱搜索音乐作品的哼唱搜索、搜索翻唱音乐作品 的原版的翻唱歌曲搜索等。 作为一种根据音乐作品的语音信号估计与歌声相关的旋律的特征量(即, 歌声的基频)的方法,提出了根据频谱的最大峰值估计特征量的方法(例如,参见 M. Goto, 〃A real-time music-scene-description system:predominant-FOestimation for detecting melody and bass line in real-world audio signals",Speech Communication(ISCA 期刊),第 43 卷,第 4 号,第 311-329 页,2004 年 9 月) 另外,还提出了一种通过使用歌声的音高波动来提取歌声的方法(例如,参见 H. Tachibana, T. 0no, N. 0no, S. Sagayama, ^Melody line estimation in homophonic music audio signals based on temporal-variability of melodic source' ICASSP2010会?艮, 第 425-428 页,2010年3 月)。 在"Melody line estimation in homophonic music audio signals based on temporal-variability of melodic source"的技术中,分析频率方向上的能量和时间方向 上的能量以提取歌声的基频的特征量等。
技术实现思路
然而,在 "A real-time music-scene-description system:predominant-FOestimation for detecting melody and bass line in real-world audio signals"的技术中,例如,在与乐器相关的旋律的音量大的情况下,频 谱的最大峰值对应于乐器的基频,因而很难精确地提取歌声。 另夕卜,在"Melody line estimation in homophonic music audio signals based on temporal-variability of melodic source"的技术中,需要分析时间上长的语音信号, 并且处理负荷变大。因而,例如,难以在便携式音乐播放器等中实现该技术。 鉴于如上所述的状况而公开了本公开内容,并且期望在不增加处理负荷的情况下 精确地提取歌声。 根据本公开内容的实施例,提供了一种音乐信号处理设备,其包括频谱变换单元、 滤波器、频率特征量生成单元以及旋律特征量序列获取单元。频谱变换单元被配置为将音 乐信号变换成频谱,该音乐信号是包含具有旋律的部分的音乐作品的信号。滤波器被配置 为去除频谱的陡峭峰。频率特征量生成单元被配置为根据从滤波器输出的信号生成所述部 分的基频分量得到强调的频率特征量。旋律特征量序列获取单元被配置为基于频率特征量 来获取旋律特征量序列,该旋律特征量序列指定所述部分在每个时间处的基频。 该部分可包括歌声,并且频率特征量生成单元可被配置为生成歌声的基频分量得 到强调的频率特征量。 频率特征量生成单元可被配置为对从滤波器输出的信号进行归一化,以生成该部 分的基频分量得到强调的频率特征量。 频率特征量生成单元可被配置为对从滤波器输出的信号进行归一化并加上谐波 分量,以生成该部分的基频分量得到强调的频率特征量。 旋律特征量序列获取单元可被配置为基于时间上相邻的频率特征量的差绝对值 来对频率特征量(在所述频率特征量中该部分的基频分量得到强调并且所述频率特征量 按时间顺序排列)进行分组,以生成特征量序列候选,并且通过动态规划选择特征量序列 候选以获取旋律特征量序列。 音乐信号处理设备还可包括音高走势(pitch trend)估计单元,其被配置为对该 部分的基频分量得到强调的频率特征量的自相关函数进行平均以估计该部分的音高走势, 其中旋律特征量序列获取单元可被配置为通过动态规划以及基于音高走势来选择特征量 序列候选以获取旋律特征量序列。 根据本公开内容的另一实施例,提供了一种音乐信号处理方法,包括:用频谱变换 单元将音乐信号变换成频谱,音乐信号是包含具有旋律的部分的音乐作品的信号;用滤波 器去除频谱的陡峭峰;用频率特征量生成单元根据从滤波器输出的信号生成所述部分的基 频分量得到强调的频率特征量;以及用旋律特征量序列获取单元基于频率特征量来获取旋 律特征量序列,所述旋律特征量序列指定所述部分在每个时间处的基频。 根据本公开内容的又一个实施例,提供了一种程序,其使得计算机用作音乐信号 处理设备,所述设备包括:频谱变换单元,被配置为将音乐信号变换成频谱,音乐信号是包 含具有旋律的部分的音乐作品的信号;滤波器,被配置为去除频谱的陡峭峰;频率特征量 生成单元,被配置为根据从滤波器输出的信号生成所述部分的基频分量得到强调的频率特 征量;以及旋律特征量序列获取单元,被配置为基于频率特征量来获取旋律特征量序列,所 述旋律特征量序列指定所述部分在每个时间处的基频。 根据本公开内容的实施例,将作为包含具有旋律的部分的音乐作品的信号的音乐 信号变换成频谱,去除频谱的陡峭峰,根据从滤波器输出的信号生成该部分的基频分量得 到强调的频率特征量,并且基于频率特征量来获取指定所述部分在每个时间处的基频的旋 律特征量序列。 根据本公开内容,可以在不增加处理负荷的情况下精确地提取歌声。 如附图所示,根据以下对本公开内容的最佳模式实施例的详细描述,本公开内容 的这些和其它目的、特征和优点将变得更加明显。 【专利附图】【附图说明】 图1是示出根据本公开内容的实施例的旋律检索设备的配置示例的框图; 图2是用于描述低通滤波器的特性的图; 图3A、图3B、图3C和图3D均是用于详细本文档来自技高网
...

【技术保护点】
一种音乐信号处理设备,包括:频谱变换单元,被配置为将音乐信号变换成频谱,所述音乐信号是包含具有旋律的部分的音乐作品的信号;滤波器,被配置为去除所述频谱的陡峭峰;频率特征量生成单元,被配置为根据从所述滤波器输出的信号生成所述部分的基频分量得到强调的频率特征量;以及旋律特征量序列获取单元,被配置为基于所述频率特征量来获取旋律特征量序列,所述旋律特征量序列指定所述部分在每个时间处的基频。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:角尾衣未留
申请(专利权)人:索尼公司
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1