当前位置: 首页 > 专利查询>索尼公司专利>正文

音乐片段检测设备和方法以及音乐信号检测设备技术

技术编号:7918314 阅读:241 留言:0更新日期:2012-10-25 03:11
本公开涉及音乐片段检测设备和方法以及音乐信号检测设备。基于被变换到时间频率域中的输入信号的每个区域的信号分量的强度(例如功率频谱)和通过逼近所述信号分量的强度而获得的函数(二次函数),指标计算单元计算所述信号分量的音调指标。音乐确定单元基于音调指标确定输入信号的每个区域是否包括音乐。本技术可以应用于音乐片段检测设备,该音乐片段检测设备从其中音乐与噪声相混合的输入信号中检测音乐部分。

【技术实现步骤摘要】

本技术涉及音乐片段检测设备和方法、程序、记录介质以及音乐信号检测设备,并且更加具体地涉及能够从输入信号中检测音乐部分的音乐片段检测设备和方法、程序、记录介质以及音乐信号检测设备。
技术介绍
过去,多首歌曲(音乐)已用在电视广播或无线电广播的广播节目中。在广播节目当中,存在如音乐节目中那样音乐明显地用作主要部分的节目,以及如戏剧中那样音乐用作背景音乐(BGM)的节目。对于广播节目的观众而言,常常存在例如仅再生和观看音乐节目的音乐部分的需要。 进一步,对于广播电台而言,常常存在如下需要容易地支付版权费,或者涉及根据广播节目通过管理使用的音乐来对广播节目进行编辑。当准备了音乐数据库时,这可以通过使用如下技术来实现将广播节目的语音信号和数据库的语音信号相比较,并且搜索广播节目的语音信号中包括的音乐。然而,当没有准备音乐数据库时,或者当广播节目的语音信号中包括的音乐没有登记到数据库时,难以使用上面描述的音乐搜索技术。在这种情况下,用户不得不收听广播节目并检查音乐的存在与否或者一致性。收听这样的大量广播节目会花费许多时间和努力。在这点上,已提议了从广播节目的语音信号中检测包括音乐的片段的技术。例如,存在如下技术当输入信号被变换成频谱时,基于峰值在时间方向上持续的时间段来检测音乐片段(例如参见日本专利申请公开(JP-A)第10-301594号)。
技术实现思路
根据JP-A第10-301594号中公开的技术,可以以高精确度从仅在特定时间包括音乐的输入信号(诸如音乐节目的语音信号或者其中与音乐相比具有足够较低水平的非音乐声音(在下文中称之为“噪声”)与音乐相混合的输入信号)中检测音乐片段。然而,从其中音乐作为BGM与噪声(如具有与如戏剧中那样的音乐几乎相同水平的语音)相混合的输入信号中,难以适当地检测频谱的峰值,所以检测音乐片段的准确性很可能降低。进一步,存在如下技术使用诸如对话或解说之类的语音通常被定向到广播节目中的中心这一特征,通过从输入信号的左声道信号中减去右声道信号(或者从右声道信号中减去左声道信号)来排除语音(噪声)的影响。然而,难以将这种技术应用于电视广播,并且同样难以将这种技术应用于其中音乐被定向到中心的输入信号。另外,独立于左右声道而生成通过语音压缩而得到的量化噪声,这样一来在这种技术中,与原始输入信号具有低相关性的量化噪声就可能包括在相减信号中。进而,在频谱中被形成以在时间方向上持续的峰值不限于通过音乐造成,而是峰值可以通过噪声、旁瓣、干扰或时变音调等而造成。因为这个原因,难以从基于峰值的音乐片段的检测结果中完全排除除了音乐之外的噪声的影响。如上所述,已难以以高精确度从其中音乐与具有几乎与音乐相同的水平的噪声相混合的输入信号中检测音乐部分。考虑到前述状况而做出本技术,并且希望以高精确度从输入信号中检测音乐部分。根据本技术的实施例,提供了一种音乐片段检测设备,该音乐片段检测设备包括指标计算单元,其基于被变换到时间频率域中的输入信号的每个区域的信号分量的强度和通过逼近所述信号分量的强度而获得的函数,来计算所述信号分量的音调指标;以及音乐确定单元,其基于所述音调指标确定所述输入信号的每个区域是否包括音乐。指标计算单元可以设置有最大点检测单元,其从预定时间段的输入信号中检测信号分量的最大强度点;以及逼近处理单元,其通过二次函数在最大点附近逼近信号分量 的强度。基于信号分量在最大点附近的强度和二次函数之间的误差,指标计算单元可以计算该指标。指标计算单元可以根据二次函数的曲率来调整指标。指标计算单元可以根据二次函数的最大点的频率来调整指标。音乐片段检测设备可以进一步包括特征量计算单元,其基于对应于预定时间的输入信号的每个区域的音调指标,计算对应于所述预定时间的输入信号的特征量;并且当特征量大于预定阈值时,音乐确定单元可以确定对应于预定时间的输入信号包括音乐。通过针对每个频率在时间方向上求取对应于预定时间的输入信号的每个区域的音调指标的积分,特征量计算单元可以计算该特征量。通过在对应于预定时间的输入信号的每个区域中针对每个频率求取其中大于预定阈值的音调指标在时间方向上最连续的区域的音调指标的积分,特征量计算单元可以计算该特征量。音乐片段检测设备可以进一步包括滤波处理单元,其在时间方向上对特征量进行滤波;并且当在时间方向上滤波的特征量大于预定阈值时,音乐确定单元可以确定对应于预定时间的输入信号包括音乐。根据本技术的另一个实施例,提供了一种检测音乐片段的方法,该方法包括基于被变换到时间频率域中的输入信号的每个区域的信号分量的强度和通过逼近所述信号分量的强度而获得的函数,来计算所述信号分量的音调指标;以及基于所述音调指标确定所述输入信号的每个区域是否包括音乐。根据本技术的还有另一个实施例,提供了一种程序和一种记录在记录介质中的程序,该程序使计算机执行以下过程基于被变换到时间频率域中的输入信号的每个区域的信号分量的强度和通过逼近所述信号分量的强度而获得的函数,来计算所述信号分量的音调指标;以及基于所述音调指标确定所述输入信号的每个区域是否包括音乐。根据本技术的还有另一个实施例,提供了一种音乐信号检测设备,该音乐信号检测设备包括指标计算单元,其基于被变换到时间频率域中的输入信号的每个区域的信号分量的强度和通过逼近所述信号分量的强度而获得的函数,来计算所述信号分量的音调指标。根据本技术的实施例,基于被变换到时间频率域中的输入信号的每个区域的信号分量的强度和通过逼近所述信号分量的强度而获得的函数,来计算所述信号分量的音调指标,并且基于所述音调指标确定所述输入信号的每个区域是否包括音乐。根据上面描述的本技术的实施例,可以以高精确度从输入信号中检测音乐部分。附图说明图I是图示根据本技术实施例的音乐片段检测设备的配置的框图;图2是图示指标计算单元的功能配置例子的框图;图3是图示特征量计算单元的功能配置例子的框图; 图4是用于描述音乐片段检测过程的流程图;图5是用于描述指标计算过程的流程图;图6是用于描述对峰值的检测的示图;图7是用于描述对峰值周围的功率频谱的逼近的示图;图8是用于描述指标调整函数的示图;图9是用于描述输入信号的音调指标的例子的示图;图10是用于描述特征量计算过程的流程图;图11是用于描述对特征量的计算的示图;图12是用于描述对特征量的计算的示图;图13是图示特征量计算单元的另一个功能配置例子的框图;图14是用于描述特征量计算过程的流程图;图15是用于描述对特征量的计算的示图;图16是用于描述通过现有技术对确定结果进行滤波的示图;图17是图示音乐片段检测设备的另一个功能配置例子的框图;图18是用于描述音乐片段检测过程的流程图;图19是用于描述对特征量进行滤波的示图;以及图20是图示计算机的硬件配置例子的框图。具体实施例方式在下文中,参考附图来详细地描述本专利技术的优选实施例。注意,在本说明书和附图中,具有基本上相同功能和结构的结构性元件用相同的标号来指示,并且省略对这些结构性元件的重复说明。在下文中,参考附图来描述本技术的实施例。按照以下顺序进行描述。I.音乐片段检测设备的配置2.音乐片段检测过程3.其它配置〈I.音乐片段检测设备的配置>图I图示了根据本技术实施例的音乐片段检测设备的配置。图I的音乐片段检本文档来自技高网...

【技术保护点】
一种音乐片段检测设备,包括:指标计算单元,其基于被变换到时间频率域中的输入信号的每个区域的信号分量的强度和通过逼近所述信号分量的强度而获得的函数,来计算所述信号分量的音调指标;以及音乐确定单元,其基于所述音调指标确定所述输入信号的每个区域是否包括音乐。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:东山惠祐安部素嗣
申请(专利权)人:索尼公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1