用于分析音频信息以确定音高和/或分数线性调频斜率的系统及方法技术方案

技术编号:10278992 阅读:215 留言:0更新日期:2014-08-02 19:40
一种可以用于分析音频信息的系统及方法。所述系统及方法可以包括对于音频信号确定该音频信号中所表示的声音的估计音高、该音频信号中所表示的声音的估计线性调频斜率(或分数线性调频斜率)和/或该音频信号中所表示的声音的其他参数。其中一个或多个参数可以通过对由该音频信号得到的经变换的音频信息进行分析来确定(例如,经过傅立叶变换、快速傅立叶变换、短时傅立叶变换、谱运动变换和/或其他变换)。可以采用统计分析来确定与该音频信号中所表示的声音具有音高和/或线性调频斜率(或分数线性调频斜率)的似然相关的度量。这样的度量可用于确定估计音高和/或分数线性调频斜率。

【技术实现步骤摘要】
【国外来华专利技术】相关申请的交叉引用本申请要求于2011年8月8日提交的题为“(SYSTEM AND METHOD FOR ANALYZING AUDIOINFORMANDION TO DETERMINE PITCH AND/OR FRACTIONAL CHIRP RATE)”的美国专利申请序列号N0.13/205,455的优先权,该申请的全部内容通过引用结合于此。
本专利技术涉及通过根据时间采样窗口期的音频信息的变换确定音调似然度量和音高似然度量来分析音频信息,以确定音频信息在时间采样窗口期内的声音的音高和/或分数线性调频斜率(fractional chirp rate)。
技术介绍
用于分析经变换的音频信息以检测经变换的音频信息中所表示的声音的音高的系统及方法是已知的。一般来讲,这些技术集中在分析经变换的音频信息亦或是分析此前经变换的音频信息的进一步变换(例如,倒谱),以及比较振幅峰值与阈值以识别经变换的音频信息中所表示的音调。通过经识别的音调,可以估计音高。这些技术在最佳条件下具有相对的准确度和精确性。然而,在“噪声”条件(例如,声音噪声或者处理噪声)下,常规技术的准确度和/或精确性会显著下降。由于许多应用了这些技术的环境和/或音频信号可能具有相当大的噪声,用于检测音高的常规方法可能仅有很小的作用。
技术实现思路
本专利技术的一方面涉及一种分析音频信息的系统及方法。该系统及方法可以包括对于音频信号确定该音频信号中所表示的声音的估计音高、该音频信号中所表示的声音的估计线性调频斜率(或分数线性调频斜率)和/或该音频信号中所表示的声音的其他参数。其中一个或多个参数可以通过对由该音频信号得到的经变换的音频信息进行分析来确定(例如,经过傅立叶变换、快速傅立叶变换、短时傅立叶变换、谱运动变换和/或其他变换)。可以采用统计分析来确定与该音频信号中所表示的声音具有音高和/或线性调频斜率(或分数线性调频斜率)的似然相关的度量。这样的度量可用于估计音高和/或分数线性调频斜率。在一些实施方式中,一种系统可以配置用于分析音频信息。该系统可以包括一个或多个处理器,其用于执行计算机程序模块。该计算机程序模块可以包括音频信息模块、音调似然模块、音高似然模块、估计音高模块和/或其他模块中的一个或多个。音频信息模块可以用于获得代表一个或多个声音的经变换的音频信息。经变换的音频信息可以在时间采样窗口期内将与信号强度有关的系数的幅值指明为音频信号的频率的函数。在一些实施方式中,该时间采样窗口期的经变换的音频信息可以包括多个经变换的音频信息组。各个经变换的音频信息组可以与不同分数线性调频斜率相对应。获得经变换的音频信息可以包括:变换该音频信号;通过通信传输接收该经变换的音频信息;访问存储的经变换的音频信息;和/或用于获得信息的其他技术。音调似然模块可以用于通过所获得的经变换的音频信息确定在时间采样窗口期内音调似然度量作为音频信号的频率的函数。给定频率的音调似然度量可以表示音频信号中所表示的声音在时间采样窗口期期间具有给定频率处的音调的似然。音调似然模块可以用于使得给定频率的音调似然度量是基于(i)具有函数宽度并且在给定频率上居中的峰值函数与(ii)在给定频率上居中的函数宽度范围内经变换的音频信息之间的相互关系。该峰值函数可以包括高斯函数和/或其他函数。音高似然度量模块可以用于基于音调似然度量来确定在时间采样窗口期内音高似然度量作为音频信号的音高的函数。给定音高的音高似然度量可以与音频信号所表示的声音具有给定音高的似然有关。音高似然模块可以用于使得给定音高的音高似然度量能够确定,其是通过累加经确定的用于与给定音高的谐波相对应的音调的音调似然度量来确定的。在一些实施方式中,音高似然模块可以包括对数子模块、求和子模块和/或其他子模块。对数子模块可以用于取音调似然度量的对数来确定音调似然度量的对数作为频率的函数。求和子模块可以用于通过对与各个音高相对应的音调似然度量的对数求和来确定各个音高的音高似然度量。估计音高模块可以用于基于音高似然度量来确定在时间采样窗口期内的音频信号中所表示的声音的估计音高。确定估计音高可以包括识别音高似然度量在时间采样窗口期内具有极大值的音高。在一些实施方式中,经变换的音频信息包括多个与单独的分数线性调频斜率相对应的经变换的音频信息组,可以在各个经变换的音频信息组内分别确定音高似然度量,以确定在该时间采样窗口期内的音频信号的音高似然度量作为音高和分数线性调频斜率的函数。在这些实施方式中,估计音高模块可以用于根据音高似然度量确定估计音高和估计分数线性调频斜率。这可以包括识别音高似然度量在时间采样窗口期内具有极大值的音高和线性调频斜率。本文所述的系统和/或方法的这些和其他目的、特征和特性以及操作方法和结构的相关元件的功能及制造的零件和经济性的组合在以下参照附图的描述和所附权利要求书后会变得更加清楚,所有的这些附图、描述和所附权利要求书构成本说明书的一部分,其中在多个附图中相似的附图标记表示一致的零件。然而,应当明确理解的是,附图仅仅用于举例说明和描述的目的,并且并非旨在界定对本专利技术的限制。除非上下文中清楚地表明,本说明书中和权利要求书中使用的单数形式“一个”、“一种”以及“该”包括多个指示对象。【附图说明】图1不出了用于分析音频信息的系统。图2示出了经变换的音频信息的图形。图3示出了音调似然度量与频率的图形。图4示出了音高似然度量与音高的图形。图5示出了音高似然度量作为音高和分数线性调频斜率的函数的图形。图6示出了一种分析音频信息的方法。【具体实施方式】图1不出了用于分析音频信息的系统10。系统10可以用于对音频信号确定音频信号中所表示的声音的估计音高、音频信号中所表示的声音的估计的线性调频斜率(或分数线性调频斜率)和/或音频信号中所表示的声音的其他参数。系统10可用于采用统计分析提供与音频信号中所表示的声音具有音高和/或线性调频斜率(或分数线性调频斜率)的似然相关的度量。系统10可以在用于处理音频信号的总体系统(未示出)中实施。例如,总体系统可以用于将音频信号中所表示的声音分段(例如,在音频信号中将声音分成对应于不同声源的组,不同声源例如为人类讲话)、将音频信号中所表示的声音分类(例如,将声音归为具体的声源,例如,具体的人类讲话)、重构音频信号中所表示的声音和/或以其他方式处理音频信号。在一些实施方式中,系统10可以包括一个或多个处理器12、电子存储器14、用户接口 16和/或其他元件中的一个或多个。处理器12可以用于执行一个或多个计算机程序模块。计算机程序模块可以用于通过软件;硬件;固件;软件、硬件和/或固件的一些组合;和/或用于配置处理器12的处理能力的其他机制来执行计算机程序模块。在一些实施方式中,一个或多个计算机程序模块可以包括音频信息模块18、音调似然模块20、音高似然模块22、估计音高模块24和/或其他模块中的一个或多个。音频信息模块18可以用于获得代表一个或多个声音的经变换的音频信息。经变换的音频信息可以包括将音频信号变换至频域(或伪频域)的变换,例如,离散傅立叶变换、快速傅立叶变换、短时傅立叶变换和/或其他变换。经变换的音频信号可以包括将音频信号变换至频率-调频域,例如,于2011年8月8日提交的题为“采用本文档来自技高网...

【技术保护点】
一种用于分析音频信息的系统,所述系统包括:一个或多个处理器,其用于执行计算机程序模块,所述计算机程序模块包括:音频信息模块,其用于获得表示一个或多个声音的经变换的音频信息,其中所述经变换的音频信息指明了在时间采样窗口期内与能量幅值有关的系数的幅值作为音频信号的频率的函数;以及音调似然模块,其用于根据所获得的经变换的音频信息来确定在所述时间采样窗口期内音调似然度量作为所述音频信号的频率的函数,其中给定频率的音调似然度量表示由音频信号所表示的声音在所述时间采样窗口期期间具有在所述给定频率的音调的似然。

【技术特征摘要】
【国外来华专利技术】2011.08.08 US 13/205,4551.一种用于分析音频信息的系统,所述系统包括: 一个或多个处理器,其用于执行计算机程序模块,所述计算机程序模块包括: 音频信息模块,其用于获得表示一个或多个声音的经变换的音频信息,其中所述经变换的音频信息指明了在时间采样窗口期内与能量幅值有关的系数的幅值作为音频信号的频率的函数;以及 音调似然模块,其用于根据所获得的经变换的音频信息来确定在所述时间采样窗口期内音调似然度量作为所述音频信号的频率的函数,其中给定频率的音调似然度量表示由音频信号所表示的声音在所述时间采样窗口期期间具有在所述给定频率的音调的似然。2.如权利要求1所述的系统,其中所述计算机程序模块进一步包括音高似然模块,其用于基于所述音调似然度量来确定在所述时间采样窗口期内音高似然度量作为所述音频信号的音高的函数,其中给定音高的音高似然度量与所述音频信号所表示的声音具有所述给定首闻的似然相关。3.如权利要求2所述的系统,其中所述音高似然模块用于使得所述给定音高的音高似然度量能够被确定,其是通过累加经确定的用于与所述给定音高的谐波相对应的音调的音调似然度量来确定的。4.如权利要求3所述的系统,其中所述音高似然模块包括: 对数子模块,其用于取所述音调似然度量的对数来确定所述音调似然度量的对数作为频率的函数;以及 求和子模块,其用于通过对与各个音高相对应的音调似然度量的对数求和来确定各个音高的音高似然度量。5.如权利要求2所述的系统,其中所述计算机程序模块进一步包括估计音高模块,其用于基于所述音高似然度量来确定在所述时间采样窗口期内所述音频信号中所表示的声音的估计音高。6.如权利要求5所述的系统,其中所述估计音高模块用于使得确定所述估计的音高包括识别所述音高似然度量在所述时间采样窗口期内具有极大值的音高。7.如权利要求3所述的系统,其中所述经变换的音频信息包括多个与单独的分数线性调频斜率相对应的经变换的音频信息组,其中所述音调似然模块和所述音高似然模块用于使得所述音高似然度量在各个经变换的音频信息组内被分别确定,以确定在所述时间采样窗口期内所述音频信号的所述音高似然度量作为音高和分数线性调频斜率的函数。8.如权利要求7所述的系统,其中所述计算机程序模块进一步包括估计音高模块,其用于确定估计音高和估计分数线性调频斜率,并且其中确定估计音高和估计分数线性调频斜率包括识别所述音高似然度量在所述时间采样窗口期内具有极大值的音高和线性调频斜率。9.如权利要求1所述的系统,其中所述音调似然模块用于使得给定频率的音调似然度量是基...

【专利技术属性】
技术研发人员:大卫·C·布兰得利尼古拉斯·K·费舍尔罗伯特·N·希尔顿罗德尼·加托德里克·R·鲁斯
申请(专利权)人:英特里斯伊斯公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1