使用具有时间演化信息的基底函数来分解音乐信号制造技术

技术编号:8886549 阅读:157 留言:0更新日期:2013-07-05 03:29
本发明专利技术揭示使用基底函数库存和稀疏恢复技术分解多源信号。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及音频信号处理。
技术介绍
便携式装置(例如,智能手机、上网本、便携式计算机、平板计算机)或电子游戏机上的许多音乐应用程序可供单个用户使用。在这些情况下,装置的用户哼唱旋律、演唱歌曲或演奏乐器,同时装置记录所得音频信号。所记录的信号接着可由应用程序来分析其音高/音调升降曲线,并且用户可以选择处理操作,例如,纠正或以其它方式变更升降曲线,用不同音高或乐器音色来对信号进 行上混操作(upmix)等。此类应用程序的实例包含QUSIC应用程序(QUALCOMM公司,圣地亚哥(San Diego), CA);例如吉他英雄(Guitar Hero)和摇滚乐队(Rock Band) (Harmonix音乐系统,剑桥,MA)等的电子游戏;以及卡拉0K、单人乐队(one-man-band)及其它记录应用程序。许多电子游戏(例如,吉他英雄、摇滚乐队)和音乐会音乐场景可能涉及多个乐器和歌手同时演出。当前市售游戏和音乐制作系统要求顺序地或在具有紧密定位的麦克风的情况下演奏这些情形,以能够单独地对这些情形进行分析、后处理及上混操作。这些约束可在音乐制作的情况下限制控制干扰和/或记录空间效应的能力,且可在电子游戏的情况下导致受限制的用户体验。
技术实现思路
一种根据一般配置分解音频信号的方法包含针对所述音频信号的多个时间片段中的每一者,计算在频率范围内的对应信号表示。这种方法还包含基于所述多个所计算的信号表示和多个基底函数计算激活系数的向量。在这种方法中,所述向量的每一激活系数对应于所述多个基底函数中的不同基底函数,且所述多个基底函数中的每一者包括在所述频率范围内的第一对应信号表示,和不同于所述第一对应信号表示的在所述频率范围内的第二对应信号表示。还揭示具有有形特征的计算机可读存储媒体(例如,非瞬时媒体),所述有形特征使读取所述特征的机器执行此种方法。—种用于根据一般配置分解音频信号的设备包含用于针对所述音频信号的多个时间片段中的每一者计算在频率范围内的对应信号表示的装置;及用于基于所述多个所计算的信号表示和多个基底函数计算激活系数的向量的装置。在这种设备中,所述向量的每一激活系数对应于所述多个基底函数中的不同基底函数,且所述多个基底函数中的每一者包括在所述频率范围内的第一对应信号表示,和不同于所述第一对应信号表示的在所述频率范围内的第二对应信号表示。一种用于根据另一一般配置分解音频信号的设备包含经配置以针对所述音频信号的多个时间片段中的每一者计算在频率范围内的对应信号表示的变换模块;及经配置以基于所述多个所计算的信号表示和多个基底函数计算激活系数的向量的系数向量计算器。在这种设备中,所述向量的每一激活系数对应于所述多个基底函数中的不同基底函数,且所述多个基底函数中的每一者包括在所述频率范围内的第一对应信号表示,和不同于所述第一对应信号表示的在所述频率范围内的第二对应信号表示。附图说明图1A展示了根据一般配置的方法MlOO的流程图。图1B展示了方法MlOO的实施方案M200的流程图。图1C展示了根据一般配置的用于分解音频信号的设备MF100的方框图。图1D展示了根据另一一般配置的用于分解音频信号的设备AlOO的方框图。图2A展示了方法MlOO的实施方案M300的流程图。图2B展示了设备AlOO的实施方案A300的方框图。图2C展示了设备AlOO的另一实施方案A310的方框图。图3A展示了方法M200的实施方案M400的流程图。图3B展示了方法M200的实施方案M500的流程图。图4A展示了方法MlOO的实施方案M600的流程图。图4B展示了设备AlOO的实施方案A700的方框图。图5展示了设备AlOO的实施方案A800的方框图。图6展示了基底函数库存的第二实例。图7展示了具有和声鸣响的语音的声谱图。图8展示了在图6的库存中的图7的声谱图的稀疏表示。图9图解说明模型Bf=y。图10展示由方法MlOO产生的分离结果的曲线图。图11图解说明图9的模型的修改B’ f=y。图12展示了在钢琴和长笛的音调的未定期间基底函数的时域演化的曲线图。图13展示了由方法M400产生的分离结果的曲线图。图14展示了在音调F5处的钢琴和长笛的基底函数的曲线图(左)和在音调F5处的钢琴和长笛的预加重基底函数的曲线图(右)。图15图解说明多个声源在活跃的情形。图16图解说明源紧密地挨在一起且一个源位于另一源之后的情形。图17图解说明分析个别空间集群的结果。图18展示了基底函数库存的第一实例。图19展示了吉他音调的声谱图。图20展示了在图18的库存中的图19的声谱图的稀疏表示。图21展示了将开始检测方法应用于两个不同复合信号实例的结果的声谱图。图22到图25表明将基于开始检测的后处理应用于第一复合信号实例的结果。图26到图32表明将基于开始检测的后处理应用于第二复合信号实例的结果。图33到图39是表明将基于开始检测的后处理应用于第一复合信号实例的结果的声谱图。图40到图46是表明将基于开始检测的后处理应用于第二复合信号实例的结果的声谱图。图47A展示了评估应用于钢琴-长笛测试实例的开始检测方法的性能的结果。图47B展示了通信装置D20的方框图。图48展示了手机HlOO的正视图、后视图和侧视图。具体实施方式揭示了使用基底函数库存和稀疏恢复技术来分解音频信号,其中基底函数库存包含与音调的未定期间音符的频谱改变有关的信息。此类分解可用以支持信号的分析、编码、再现和/或合成。本文中展示了对包含来自和声(即,非打击)和打击乐器的声音的混合物的音频信号的定量分析的实例。除非由其上下文明确限制,否则本文中使用术语“信号”来指示其普通意义中的任一者,包括在电线、总线或其它传输媒体上表达的存储器位置(或存储器位置集合)的状态。除非由其上下文明确限制,否则本文中使用术语“产生”来指示其普通意义中的任一者,例如计算或以其它方式产生。除非由其上下文明确限制,否则本文中使用术语“计算”来指示其普通意义中的任一者,例如计算、评估、平滑和/或从多个值中进行选择。除非由其上下文明确限制,否则使用术语“获得”来指示其普通意义中的任一者,例如计算、导出、接收(例如,从外部装置)和/或检索(例如,从存储元件阵列)。除非由其上下文明确限制,否则使用术语“选择”来指示其普通意义中的任一者,例如识别、指示、应用和/或使用两者或两者以上的集合中的不到全部的至少一者。在术语“包括”用于本描述及权利要求书中的情况下,其不排除其它元件或操作。术语“基于”(如“A基于B”)用以指示其普通意义中的任一者,包含情况⑴“从……导出”(例如,“B是A的前驱体”),(ii) “至少基于”(例如,“A至少基于B”)及在特定上下文中适当的情况下(iii) “等于”(例如,“A等于B”)。类似地,术语“响应于”用以指示其普通意义中的任一者,包含“至少响应于”。对多麦克风音频传感装置的麦克风的“位置”的参考指示麦克风的声学敏感面的中心的位置,除非上下文以其它方式指示。根据特定上下文,术语“信道”有时用以指示信号路径,且在其它时候指示由此路径携带的信号。除非以其它方式指示,否则术语“系列”用以指示两个或两个以上项目的序列。术语“对数”用以指示以十为底数的对数,但此运算延伸到其它底数(例如,底数二)属于本专利技术的范围本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:埃里克·维瑟郭尹义朱默飞刘尚忆金莱轩辛钟元
申请(专利权)人:高通股份有限公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1