用于音场增强的设备及方法技术

技术编号:18789249 阅读:21 留言:0更新日期:2018-08-29 09:35
一种非瞬态计算机可读储存介质,其具有可由处理器执行的指令,用于分辨数字音频输入信号的右声道和左声道内的中心分量、侧分量和环境分量。空间比由中心分量和侧分量确定。数字音频输入信号基于空间比调整,以形成预处理信号。递归串扰消除处理在预处理信号上执行,以形成串扰消除。串扰消除信号的中心分量被重新校正来产生最终数字音频输出。

【技术实现步骤摘要】
用于音场增强的设备及方法本申请是2014年12月12日递交的国际申请于2016年8月11日进入中国国家阶段,中国申请号为201480075389.4,专利技术名称为“用于音场增强的设备及方法”的专利申请的分案申请。
本专利技术大体上涉及数字音频信号的处理。更具体而言,本专利技术涉及音场增强的技术。
技术介绍
音场是立体声场景的左侧极限与右侧极限之间感知的距离。立体声图像包括出现的占据音场的幻像图像。为了传达自然的收听环境,需要良好的立体声图像。平而窄的立体声图像使得所有声音被感知为都来自一个方向,且因此声音呈现为单声道的。消费者电子装置(例如,台式计算机、膝上计算机、平板计算机、可穿戴计算机、游戏机、电视机等等)通常包括扬声器。令人遗憾的是,空间限制导致了差的音场性能。已经尝试了使用头相关传递函数(HRTF)来解决此问题。HRTF用于产生虚拟环绕声扬声器。令人遗憾的是,HRTF基于个人的耳朵和体型。因此,任何其它耳朵会经历具有退化的声定位的空间失真。因此,将期望的是在消费者装置中获得提高的音场性能,而不依靠合成或测量的HRTF。
技术实现思路
一种非瞬态计算机可读储存介质,其具有可由处理器执行的指令,用于分辨数字音频输入信号的右声道和左声道内的中心分量、侧分量和环境分量。空间比由中心分量和侧分量确定。数字音频输入信号基于空间比被调整以形成预处理信号。递归串扰消除处理在预处理信号上执行,以形成串扰消除的信号。该串扰消除的信号的中心分量在后处理操作中被重新校正,以产生数字音频输出。本专利技术提供一种计算机实现的方法,包括:在具有一个或多个处理器和存储器的计算设备上执行以下步骤,其中所述存储器用于存储由所述一个或多个处理器执行的一个或多个程序模块:根据感知阈值平衡数字音频信号的左声道和右声道的空间能量分布,其中所述数字音频信号具有预定义的中心锚定;对平衡后的所述数字音频信号的右声道和左声道执行递归串扰消除以形成所述数字音频信号的串扰消除后的一对右声道和左声道;以及调整所述数字音频信号的所述串扰消除后的一对右声道和左声道以保持所述数字音频信号的所述预定义的中心锚定。本专利技术还提供一种计算设备,包括:一个或多个处理器;存储器;以及存储在所述存储器中并由所述一个或多个处理器执行的一个或多个程序模块,其中,所述一个或多个程序模块还包括指令,所述指令用以:根据感知阈值平衡数字音频信号的左声道和右声道的空间能量分布,其中所述数字音频信号具有预定义的中心锚定;对平衡后的所述数字音频信号的右声道和左声道执行递归串扰消除以形成所述数字音频信号的串扰消除后的一对右声道和左声道;以及调整所述数字音频信号的所述串扰消除后的一对右声道和左声道以保持所述数字音频信号的所述预定义的中心锚定。本专利技术另外提供一种非瞬态计算机可读储存介质,其存储有包括一个或多个处理器的计算设备可执行的指令,其中所述指令包括:根据感知阈值平衡数字音频信号的左声道和右声道的空间能量分布,其中所述数字音频信号具有预定义的中心锚定;对平衡后的所述数字音频信号的右声道和左声道执行递归串扰消除以形成所述数字音频信号的串扰消除后的一对右声道和左声道;以及调整所述数字音频信号的所述串扰消除后的一对右声道和左声道以保持所述数字音频信号的所述预定义的中心锚定。附图说明本专利技术结合参照附图的以下详细描述来被更完整的认识到,在附图中:图1示出了根据本专利技术的实施例配置的消费者电子装置。图2示出了根据本专利技术的实施例的信号处理。图3示出了根据本专利技术的实施例配置的声音增强模块。图4示出了与声音增强模块的预处理阶段相关联的处理操作。图5示出了与声音增强模块的后处理阶段相关联的处理操作。相似的参考数字是指贯穿附图的若干视图各处的对应部分。具体实施方式图1示出了根据本专利技术的实施例配置的数字消费者电子装置100。装置100包括标准构件,如,中央处理单元110和经由总线114连接的输入/输出装置112。输入/输出装置112可包括键盘、鼠标、触摸显示器、扬声器等等。网络接口电路116也连接至总线114,以提供至网络的连接(未示出)。网络可为有线网络和无线网络的任何组合。存储器120也连接至总线114。存储器120包括包含音频源信号的一个或多个音频源文件122。如下文所述,存储器120还储存声音增强模块124,其包括被中央处理单元110执行的指令,以实施本专利技术的操作。声音增强模块124还可处理经由网络接口电路116接收到的流式音频信号。图2示出了声音增强模块124可接收音频源文件122(例如,立体声源文件)。声音增强模块124处理音频源文件,以生成增强的音频输出126(例如,具有强中心场和侧分量的增强的立体声)。图3示出了声音增强模块124的实施例。在此情况下,输入为左(L)和右(R)立体声道。预处理阶段300分析空间线索,且基于计算的空间比调整输入。如下文所述,下一阶段302执行递归串扰消除。最后,如下文所述,后处理阶段304执行中心场处理,均衡和水平控制。图4示出了与预处理阶段300相关联的处理操作。在预处理阶段中,分析输入的声音,且一组多尺度特征被加回来使信息处理阶段适合在中央听觉系统中,以便收听者可清楚地感知和解码再现的声音中的信息。在一个实施例中,以总和信号402、差异信号404和频谱信息406的形式分析400空间线索。如图3中所示,总和和差异从左侧输入和右侧输入计算。两个声道的总和表示左声道和右声道中的相关分量或中间信号。总和信号306显示出出现在幻像中心处的信号,通常是电影中的对话或音乐中的声音。两个声道308的差异是硬平移(hard-panned)的声音,或侧信号。差异信号确定仅处在或朝两个扬声器中的一个出现的信号。差异信号通常是具有出现在侧部上的分量的特殊音效。分析频谱以获得频谱信息。这样做是因为中心和硬移位声音不可充分地描述音频文件或流。例如,人群声音是很随机的;其可位于中心和侧部处,或仅在侧部处。通过分析频谱,人们可判断由总和/差异步骤标记的某信号是否为主要分量(例如,对话、特殊音效)或更多的是环境声音。在频域中,环境声音作为宽带声音出现,而音效或对话作为包络谱出现。下一个处理操作是从中心和环境信息408确定空间比。"空间比"(r)被估计为代表中心图像与环境声音之间的能量分布。立体声输入首先发送至混合器310,在该处,左声道由以下计算其中LT和HT为可接受的空间比的低阈值和高阈值。α和β两者都是基于r的标量调节因子。更具体而言,α和β通过从r的固定线性变换计算,故所有项彼此相关。G为正增益因子,其确保结果声道的振幅与其输入相同。对于右声道,计算是相同的。空间比计算成代表由三个分析块(总和/差异/频谱信息)标记的中心和/或侧分量的量。如通路314上所示,其用于下一个预处理步骤(混合块312),以及后处理阶段中的混合。LT和HT为预设的感知参数,其可基于独立内容如音乐、影片或游戏优化,以优化其不同的性质。阈值基于内容的类型调整。大体上,介于0.1到0.3之间的任何阈值都是合理的。系统基于标记的特征猜测内容的类型。例如,电影具有强中心、重环境,以及动态声效。相比之下,音乐几乎没有几个环境标记以及不同声源之间的频谱-时间内容中的重叠。感知参数基于感官体验,例如声音。基于公开的感知的技术依靠人脑,以用本文档来自技高网...

【技术保护点】
1.一种计算机实现的方法,其特征在于,包括:在具有一个或多个处理器和存储器的计算设备上执行以下步骤,其中所述存储器用于存储由所述一个或多个处理器执行的一个或多个程序模块:根据感知阈值平衡数字音频信号的左声道和右声道的空间能量分布,其中所述数字音频信号具有预定义的中心锚定;对平衡后的所述数字音频信号的右声道和左声道执行递归串扰消除以形成所述数字音频信号的串扰消除后的一对右声道和左声道;以及调整所述数字音频信号的所述串扰消除后的一对右声道和左声道以保持所述数字音频信号的所述预定义的中心锚定。

【技术特征摘要】
2013.12.13 US 61/916,009;2014.04.22 US 61/982,7781.一种计算机实现的方法,其特征在于,包括:在具有一个或多个处理器和存储器的计算设备上执行以下步骤,其中所述存储器用于存储由所述一个或多个处理器执行的一个或多个程序模块:根据感知阈值平衡数字音频信号的左声道和右声道的空间能量分布,其中所述数字音频信号具有预定义的中心锚定;对平衡后的所述数字音频信号的右声道和左声道执行递归串扰消除以形成所述数字音频信号的串扰消除后的一对右声道和左声道;以及调整所述数字音频信号的所述串扰消除后的一对右声道和左声道以保持所述数字音频信号的所述预定义的中心锚定。2.根据权利要求1所述的方法,其中,平衡所述空间能量分布的步骤包括:根据所述数字音频信号的右声道和左声道生成总和信号和差异信号;使用所述总和信号和所述差异信号估计所述数字音频信号的右声道和左声道的空间能量分布;以及根据所述感知阈值调整所估计的空间能量分布。3.根据权利要求1所述的方法,其中根据所述数字音频信号的内容类型确定所述感知阈值。4.根据权利要求1所述的方法,其中所述数字音频信号的所述串扰消除后的一对右声道和左声道被进一步处理以衰减所述数字音频信号的一个或多个高频带中可听见的染色。5.根据权利要求1所述的方法,其中执行递归串扰消除的步骤还包括将来自所述右声道和所述左声道中的第一声道的消除信号添加到所述右声道和所述左声道中的第二声道而不使用头相关传递函数。6.根据权利要求5所述的方法,其中用于所述第二声道的所述消除信号是基于用于播放串扰消除后的音频信号的设备的预定义的物理配置的经衰减和延时的第一声道。7.一种计算设备,其特征在于,包括:一个或多个处理器;存储器;以及存储在所述存储器中并由所述一个或多个处理器执行的一个或多个程序模块,其中,所述一个或多个程序模块还包括指令,所述指令用以:根据感知阈值平衡数字音频信号的左声道和右声道的空间能量分布,其中所述数字音频信号具有预定义的中心锚定;对平衡后的所述数字音频信号的右声道和左声道执行递归串扰消除以形成所述数字音频信号的串扰消除后的一对右声道和左声道;以及调整所述数字音频信号的所述串扰消除后的一对右声道和左声道以保持所述数字音频信号的所述预定义的中心锚定。8.根据权利要求7所述的计算设备,其中用于平衡所述空间能量分布的指令还包括以下指令,所述指令用以:根据所述...

【专利技术属性】
技术研发人员:吴采颐
申请(专利权)人:无比的优声音科技公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1