语义音轨混合器制造技术

技术编号:9698752 阅读:182 留言:0更新日期:2014-02-21 12:22
一种用于将多个音轨混合成混合信号的混音器,包括:语义命令解释器(30、35),用以接收语义混合命令并且从该语义混合命令导出针对该多个音轨的多个混合参数;音轨处理器(70、75),用以根据该多个混合参数处理该多个音轨;以及音轨组合器(76),用以将由该音轨处理器处理的该多个音轨组合成该混合信号(MS)。一种相应的方法包括以下步骤:接收语义混合命令;从该语义混合命令导出针对该多个音轨的多个混合参数;根据该多个混合参数处理该多个音轨;以及组合由对多个音轨的处理产生的该多个音轨,以形成该混合信号。

【技术实现步骤摘要】
【国外来华专利技术】语义音轨混合器
本专利技术的领域涉及用于根据用户规定混合多轨信号的混音器。本专利技术的领域涉及音频信号处理,特别是涉及根据用户定义标准的集合,混合多轨录音的任务。本专利技术的领域还涉及用于将多个音轨混合成混合信号的方法。本专利技术的领域还涉及用于指示计算机执行混合多个音轨的方法的计算机程序。
技术介绍
多媒体内容不断增长的可用性产生用户欣赏音乐并且与音乐交互的新的方式。这些可能性面临着开发用于在这样的活动中辅助使用者的工具的挑战。从信息获取的视角看,十多年前已应对该挑战,从而产生音乐信息获取的活跃的研究领域及众多商业应用。未解决到此程度的不同方面是与可以多轨格式获得的内容的交互。多轨格式可由每个声音对象(SO)或对象的群组(轨组;stem)的分离的并时间对准的信号(亦称为单音轨(ST))组成。根据一种定义,轨组为混合中出于再混合使用的目的而单独保存(通常保存至盘或磁带)的个别成分。在音乐产生的传统程序中,多个单音轨以复杂的方式组合成混合信号(mixturesignal;MS),随后将该MS传递至最终使用者。数字音频技术的持续进化,例如,基于参数对象的音频的新的音频格式的开发在更大程度上实现与音乐的交互。使用者存取多轨录音并且可主动地控制混合程序。一些艺术家开始释放该艺术家的歌曲中的一些歌曲的轨组,为了使听众可以任何所要方式自由地再混合及再使用音乐。可以诸多方式使用以多轨格式发布的音乐或音频作品。使用者可控制不同轨的混合参数,因此强调选定的轨而衰减其他轨。例如出于伴唱机或同步演奏的目的,一个或多个轨可为无声的。诸如回音、混响、失真、合声等的音效可应用于选定轨而不影响其他轨。可从多轨格式摘录一个或多个轨,并且该所摘录的一个或多个轨可用于另一音乐作品或另一形式的音频作品中,诸如,音频书籍、演讲、播客等。在以下描述中,本文所公开的示教的应用以示例性方式论述经录音的音乐作品的主控。然而,应理解,本文所公开的示教旨在同等地解决并且覆盖涉及混合多个单音轨的任何经录音声音的处理。自动混合已为并且仍为若干研究计划的焦点。在2009年,Perez-Gonzalez等人描述多轨信号的自动均衡的方法(E.Perez-Gonzalez及J.Reiss,“AutomaticEqualizationofMulti-ChannelAudioUsingCross-AdaptiveMethods”,Proc.oftheAES127thConv.,2009年出版)。作者提供用于自动设定多轨信号的每个信号的衰减的方法。确定增益,以使得每个信号的响度等于所有信号的平均响度。相同作者的另一文章阐明“AutomaticGainandFaderControlforLiveMixing”并且出版于2009年的Proc.ofWASPAA中。语义高保真度(HiFi)为欧洲计划IST-507913的名称(H.Vinet等人,“SemanticHiFiFinalReport”,IST-507913的最终报告,2006年出版)。该报告主要涉及多媒体内容的获取、浏览及共享。此报告包括数据库中的浏览及导览、播放表产生、轨内导览(使用如独唱与合唱识别的结构分析)及元数据共享。该报告亦解决交互/创作/编辑:产生包括同步(该同步为“序连(concatenating)”音频信号,而非混合多轨信号)、语音变换、节奏变换、语音控制乐器及音效是混合。另一计划被称为“结构音频”或MPEG4的名称。结构音频实现以低比特率并且在知觉上基于使用信号的符号及语义描述的声音数据的操作及存取,来传输音频信号(cf.B.L.Vercoe及W.G.Gardner及E.D.Scheirer,“StructuredAudio:Creation,Transmission,andRenderingofParametricSoundRepresentations”,Proc.ofIEEE,第86卷,第922-940页,1998年出版)。该计划的特征为描述了用于混合多个流及添加音效的参数声音后产生。参数描述确定如何合成声音。结构音频涉及合成音频信号。在国际公开号为WO2010/111373A1的国际专利申请中,公开了一种背景获知、语音控制的接口和系统。语音控制的使用者接口系统包括:至少一个扬声器,用于将音频信号传送给用户;以及至少一个传声器,用于捕捉使用者的语音发言。一种接口装置接口连接扬声器和传声器,并提供多个音频信号至扬声器以被使用者听到。控制电路可操作地耦接至接口装置并被配置为选择多个音频信号中的至少一个作为通过传声器传送给使用者的前景音频信号。控制电路可操作用于识别使用者的语音发言并使用所识别的语音发言控制前景音频信号的选择。美国专利申请公开号US2002/0087310A1公开了一种计算机执行的方法和系统,用于处理与使用者的语音对话。来自使用者的语音输入包括指向多种概念的词语。使用者语音输入包括进行服务的请求。使用者语音输入的语音识别被用于生成识别词语。对话模板被应用到所识别的词语。对话模板具有与预定概念相关的节点。节点包括不同的请求处理信息。在对话模板内基于哪个节点相关于最接近匹配所识别词语的概念的概念来识别概念区域。通过使用包括在所识别概念区域内的节点的请求处理信息来处理使用者的请求。文章“TransientDetectionofAudioSignalsBasedonanAdaptiveCombFilterintheFrequencyDomain”,M.Kwong和R.Lefebvre提出适于音乐信号中的节奏检测的瞬态检测算法。在多个音频信号中,低能量瞬态被高能量静态音遮掩。这些被遮掩的瞬态以及更高能量和更明显的瞬态传达了关于音乐信号中的节奏和时间分段的重要信息。所提出的分段算法使用正弦模型结合频域上的适应性梳齿滤波来移除声音信号的静态分量。在滤波之后,残余信号的时间包络被分析以定位瞬态分量。结果显示提出的算法可精确地检测最低能量的瞬态。多轨录音的混合通常为常由专家、混合工程师执行的创作任务。如交互的音频格式这样的多媒体的当前发展,产生了多轨录音需要由非专家指导以自动方式或以半自动方式混合的应用。期望自动导出的混合信号具有可与由人类专家产生的混合信号相当的主观声音质量。
技术实现思路
本文所公开的示教针对该总体目标。示教涉及音频信号处理,特别是涉及出于收听的(最终)目的,根据使用者定义的录音标准的集合,混合多轨的任务。根据本文所公开的示教的混音器及用于将多个音轨混合成混合信号的方法建立非专家的充分美学设想与所得混合信号之间的联系。这些目标中的至少一个目标和/或可能的其他目标借助于根据权利要求1或权利要求16所述的混音器、根据权利要求14或权利要求17所述的用于混合多个音轨的方法及根据权利要求15或权利要求18所述的计算机程序来获得。根据本文所公开的示教,一种用于将多个音轨混合成混合信号的混音器包括语义命令解释器、音轨处理器及音轨组合器。语义命令解释器经配置用于接收语义混合命令并从该语义混合命令导出针对该多个音轨的多个混合参数。音轨处理器经配置用于根据该多个混合参数处理该多个音轨。音轨组合器经配置用于将由音轨处理器处理的多个音轨组合成混合信号。根据所公开示教,用于将多个音轨混合成混合信号的方法包括以下本文档来自技高网
...
语义音轨混合器

【技术保护点】
一种用于将多个音轨混合成混合信号(MS)的混音器,该混音器包括:?语义命令解释器(30、35),用于接收语义混合命令,并且从所述语义混合命令导出针对所述多个音轨的多个混合参数;?音轨处理器(70、75),用于根据所述多个混合参数处理所述多个音轨;以及?音轨组合器(76),用于将由所述音轨处理器处理的所述多个音轨组合成所述混合信号(MS)。

【技术特征摘要】
【国外来华专利技术】2011.02.03 EP 11153211.51.一种用于将多个音轨混合成混合信号(MS)的混音器,该混音器包括:语义音频分析器(40),被配置为通过分析所述多个音轨获得轨道信息;语义命令解释器(30、35),用于接收语义混合命令,并且从所述语义混合命令导出针对所述多个音轨的多个混合参数,其中,所述轨道信息被提供到语义至明确转换模块(65),其中,所述语义至明确转换模块(65)接收从语义混合命令导出的信息,其中,所述语义至明确转换模块(65)基于所述轨道信息和从语义混合命令导出的信息产生所述多个混合参数;音轨处理器(70、75),用于根据所述多个混合参数处理所述多个音轨;以及音轨组合器(76),用于将由所述音轨处理器处理的所述多个音轨组合成所述混合信号(MS)。2.根据权利要求1所述的混音器,其中,所述语义命令解释器(30、35)包括用于识别所述语义混合命令内的语义表达的词汇数据库(31)。3.根据权利要求1所述的混音器,还包括:音轨识别器(40、430),用于识别所述多个音轨中的目标音轨,所述目标音轨在所述语义混合命令中由音轨识别表达来指示。4.根据权利要求3所述的混音器,其中,所述音轨识别器(40、430)被配置为:从音轨模板数据库(432)获取与所述音轨识别表达对应的数据记录,所述数据记录包括关于对应乐器的信息,该关于对应乐器的信息的形式是测量值与声音样本两者中的至少一者,执行对所述多个音轨之中至少一个音轨的音色、节奏结构、频率范围、声音样本以及和声密度中的至少一项的分析,将所述分析的结果与所述数据记录比较,从而产生至少一个匹配分数,以及基于所述至少一个音轨与所述数据记录之间的所述至少一个匹配分数,来确定所述目标音轨。5.根据权利要求1所述的混音器,还包括:时间段识别器(40、460),用于识别所述多个音轨内的目标时间段,所述目标时间段在所述语义混合命令中由时间段识别表达来指示。6.根据权利要求5所述的混音器,其中,所述时间段识别器(40、460)被配置为将所述多个音轨结构化成多个时间段。7.根据权利要求5所述的混音器,其中,所述时间段识别器(40、460)被配置为执行对所述多个音轨的分析,以确定至少一个时刻,在该至少一个时刻,由所述多个音轨表示的音频信号的特征性质发生改变,并且将所述至少一个所确定的时刻用作两个邻近时间段之间的至少一个边界。8.根据权利要求1所述的混音器,还包括:元数据(42、480)接口,用于接收关于所述多个音轨的元数据(12),所述元数据(12)指示音轨或该音轨的一部分的音轨名称、音轨识别符、时间结构信息、强度信息、空间属性、音色特性以及节奏特性中的至少一个。9.根据权利要求1所述的混音器,还包括用于以语言格式接收所述语义混合命令的命令接口。10.根据权利要求1所述的混音器,还包括:示例接口(23、490),用于根据用户关于如何混合示例性混合信号的偏好,接收另一混合信号作为该示例性混合信号;以及混合信号分析器(492),用于分析所述示例性混合信号,并且基于对所述示例性混合信号的分析产生所述语义混合命令。11.根据权利要求1所述的混音器,其中,所述语义命令解释器(30、35)包括知觉处理器(63),该知觉处理器用于根据所述混合信号的听觉相关性质的知觉模型,将所述语义混合命令变换成所述多个混合参数。12.根据权利要求1所述的混音器,其中,所述语义命令解...

【专利技术属性】
技术研发人员:克里斯蒂安·乌勒于尔根·赫莱哈拉尔德·波普法尔科·里德鲁施
申请(专利权)人:弗兰霍菲尔运输应用研究公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1