当前位置: 首页 > 专利查询>索尼公司专利>正文

音频处理装置、方法和计算机可读记录介质制造方法及图纸

技术编号:15531068 阅读:260 留言:0更新日期:2017-06-04 17:55
本技术涉及能够以较低的成本改善对声像的定位的音频处理装置、方法和计算机可读记录介质。麦克风阵列收集来自声源的声音平面波。驱动信号生成单元根据通过麦克风阵列的声音收集所获得的收集的声音信号的空间频谱来生成空间域中的扬声器驱动信号。方位信息获得单元获得指示讲话的人的方位的讲话人方位信息。空间滤波器应用单元使用通过讲话人方位信息所限定的空间滤波器对扬声器驱动信号执行滤波,从而减少空间混叠。本技术适用于空间混叠控制器。

Audio processing device, method and program

The present invention relates to a sound processing apparatus, method and program that can improve the positioning of sound images at a lower cost. The microphone array collects the sound plane waves from the sound source. The drive signal generation unit generates a loudspeaker drive signal in the spatial domain according to the spatial spectrum of the acquired sound signals collected from the microphone array sounds. An azimuth information acquisition unit acquires a speaker's orientation information indicating the orientation of the speaker. The spatial filter application unit uses a spatial filter defined by speech orientation information to perform filtering of the speaker driving signal, thereby reducing spatial aliasing. The technique is applicable to a space aliasing controller.

【技术实现步骤摘要】
【国外来华专利技术】音频处理装置、方法和程序
本技术涉及音频处理装置和方法以及程序,并且特别地涉及能够以较低的成本来改善对音像的定位的音频处理装置和方法以及程序。
技术介绍
存在用于利用平面扬声器阵列或线性扬声器阵列来再现声场的常规已知的波前合成技术。这样的波前合成技术可以用于例如图1中所示的下一代双向通信等。在图1中,在其中存在谈话者W11的空间P11与其中存在谈话者W12的空间P12之间进行下一代双向通信。具体地,在空间P11中,由主要由谈话者W11发出的音频构成的声场A通过由如所示的配置有多个纵向布置的麦克风的线性麦克风阵列MCA11来拾取,并且所产生的声源信号被传输至空间P12。在示例中,所示的箭头指示作为声源的谈话者W11的音频传播的方向,并且谈话者W11的音频以从线性麦克风阵列MCA11所视的角度θ到达并且被拾取。在下文中,角度θ或音频从声源传播的方向与配置麦克风阵列的麦克风被布置的方向之间所形成的角度将被表示为到达角θ。在空间P12中,根据从空间P11传输的声源信号来生成用于再现声场A的扬声器驱动信号。然后,如所示的在空间P12中,基于由配置有多个纵向布置的扬声器的线性扬声器阵列SPA11生成的扬声器驱动信号来再现声场A。在示例中,所示的箭头指示从线性扬声器阵列SPA11输出并且被方位至谈话者W12的音频传播的方向。该传播方向与线性扬声器阵列SPA11之间所形成的角度与到达角θ相同。附带地,虽然此处未示出,但是在空间P12中也设置了线性麦克风阵列,配置有主要由谈话者W12发出的音频的声场B通过该线性麦克风阵列来拾取并且所产生的声源信号被传输至空间P11。另外,在空间P11中,根据从空间P12传输的声源信号来生成扬声器驱动信号并且由线性扬声器阵列(未示出)基于所产生的扬声器驱动信号来再现声场B。附带地,当以此方式利用麦克风阵列或扬声器阵列来再现声场时,需要布置无限多个的扬声器和麦克风以便以物理准确的方式来再现声场。例如,当扬声器或麦克风被离散地布置为如图1中所示的示例中时,产生空间混叠。通过配置扬声器阵列的扬声器的间隔或配置麦克风阵列的麦克风的间隔所计算的较低空间奈奎斯特频率来确定不被空间混叠所干扰的最高空间频率(其在下文将被表示为上限空间频率)klim。也就是说,将麦克风的间隔设为dmic并且将扬声器的间隔设为dspk,在以下等式(1)中得到上限空间频率klim。[数学公式1]如此获取的上限空间频率klim对声像的定位有影响,并且优选地一般取较高的值。另外,声源的频率(其在下文将被表示为时间频率)f与空间频率k之间的关系如以下等式(2)所示。注意,c在等式(2)中指示声速。[数学公式2]因此,当未特别取值时,可以在等式(2)中得到不被空间混叠干扰的最高时间频率(其在下文将被表示为上限时间频率)flim。上限时间频率flim对音质有影响,并且被采用以一般地论证在较高值处的高再现性或高保真度(HiFi)。这里将描述空间混叠。图2示出了基于来自声源的音频的平面波的到达角的差异的空间频谱,其也被称为角频谱,这是因为空间频谱的谱峰的位置根据平面波的到达角而改变。注意,在图2中,垂直轴指示时间频率f并且水平轴指示空间频率k。另外,线L11至线L13分别指示谱峰。在图中的左侧示出了在执行空间采样之前或在平面波被麦克风阵列拾取之前的原始平面波的到达角θ=0处的角频谱如何。在示例中,如线L11所示,谱峰出现在空间频率k的正方向上。相反地,在图中的右侧示出了通过对在到达角θ=0处的平面波进行空间采样或者通过由配置有离散布置的麦克风的麦克风阵列拾取平面波所获取的声源信号的角频谱如何。在示例中,线L12对应于线L11并且指示本来会出现的谱峰。另外,线L13指示由于空间混叠而出现的谱峰,并且在示例中,空间混叠显著地产生在其中时间频率f高于上限时间频率flim并且空间频率k为负的区域中。若无空间混叠,则谱峰本来应当出现在其中当平面波的到达角θ在π/2≤θ≤π处时空间频率k为负的区域中。因此,在图中的右侧所示的示例中,当所拾取的平面波(声场)被再现时,由于空间混叠产生的对谱峰的影响,音像被定位成好像平面波信号以各种不同角度被混合。因此,即使在根据通过声音拾取所获取的声源信号生成用于波前合成的扬声器驱动信号并且由扬声器阵列基于该扬声器驱动信号再现平面波时,倾听者也不能感知到正确的平面波。另外,当在作为示例的下一代双向通信中谈话者彼此接近时,不是产生平面波而是产生球面波,但是与平面波类似。如上所述,当产生空间混叠时音像不能被准确地定位。因此,提出了用于利用包括具有相互不同的扬声器间隔的高音扬声器单元和低音扬声器单元的两个扬声器阵列来进一步提高不被空间混叠所干扰的上限时间频率flim以减少空间混叠的技术(例如参见专利文献1)。利用该技术,可以准确地再现具有较高时间频率的信号。引文列表专利文献专利文献1:日本专利No.4124182
技术实现思路
本专利技术要解决的技术问题然而,虽然利用上述技术能够改善对音像的定位,但是需要准备用于提高上限时间频率flim的另外的扬声器阵列或两个扬声器阵列,其花费较大。理想的是,进一步提高上限时间频率flim而同时保持现有的扬声器阵列的扬声器间隔以改善对音像的定位。在该情形方面产生了本技术,并且本技术用于以较低的成来改善对音像的定位。技术问题的解决方案本技术的一个方面的音频处理装置包括:方位信息获取单元,该方位信息获取单元用于获取关于声源的方向的方位信息;以及空间滤波器应用单元,该空间滤波器应用单元用于将具有通过方位信息限定的特性的空间滤波器应用于拾音信号,该拾音信号是通过由多个麦克风构成的麦克风阵列拾取来自声源的音频而获取的。空间滤波器应用单元可以基于方位信息来确定作为空间滤波器的特性的中心频率和带宽。在将通过中心频率和带宽限定的空间频率的频带作为传输频带的情况下,空间滤波器可以被用作用于传输拾音信号的传输频带中的分量的滤波器。在将通过中心频率和带宽限定的时间频率的频带作为传输频带的情况下,空间滤波器可以被用作用于传输拾音信号的传输频带中的分量的滤波器。空间滤波器应用单元可以将空间频率器的特性确定成使得:随着通过方位信息指示的声源的方向与麦克风阵列之间所形成的角度越接近π/2,带宽越大。麦克风阵列可以被用作线性麦克风阵列。本技术的一个方面的音频处理方法或程序包括以下步骤:获取关于声源的方向的方位信息;以及将具有通过方位信息限定的特性的空间滤波器应用于拾音信号,该拾音信号是通过由多个麦克风构成的麦克风阵列拾取来自声源的音频而获取的。根据本技术的一个方面,获取关于声源的方向的方位信息,并且将具有通过方位信息限定的特性的空间滤波器应用于拾音信号,该拾音信号是通过由多个麦克风构成的麦克风阵列拾取来自声源的音频而获取的。本专利技术的效果根据本技术的一个方面,可以以较低的成本改善对音像的定位。另外,这里所描述的效果不一定被限制,还可以获得在本公开内容中描述的任何效果。附图说明图1是用于说明下一代双向通信的图。图2是用于说明空间混叠的图。图3是示出空间混叠控制器的示例性配置的图。图4是用于说明空间带通滤波器的特性的图。图5是用于说明空间带通滤波器的特性的图。图6是用于说明声场再现处理的流程图。以及图7是示出计算机的示例性本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/62/201580053837.html" title="音频处理装置、方法和计算机可读记录介质原文来自X技术">音频处理装置、方法和计算机可读记录介质</a>

【技术保护点】
一种音频处理装置,包括:方位信息获取单元,所述方位信息获取单元用于获取关于声源的方向的方位信息;以及空间滤波器应用单元,所述空间滤波器应用单元用于将具有通过所述方位信息限定的特性的空间滤波器应用于拾音信号,所述拾音信号是通过由多个麦克风构成的麦克风阵列拾取来自所述声源的音频而获取的。

【技术特征摘要】
【国外来华专利技术】2014.10.10 JP 2014-2088651.一种音频处理装置,包括:方位信息获取单元,所述方位信息获取单元用于获取关于声源的方向的方位信息;以及空间滤波器应用单元,所述空间滤波器应用单元用于将具有通过所述方位信息限定的特性的空间滤波器应用于拾音信号,所述拾音信号是通过由多个麦克风构成的麦克风阵列拾取来自所述声源的音频而获取的。2.根据权利要求1所述的音频处理装置,其中,所述空间滤波器应用单元基于所述方位信息来确定作为所述空间滤波器的特性的中心频率和带宽。3.根据权利要求2所述的音频处理装置,其中,在将通过所述中心频率和所述带宽限定的空间频率的频带作为传输频带的情况下,所述空间滤波器用于传输所述拾音信号的所述传输频带中的分量。4.根据权利要求2所述的音频处理装置,其中,在将通过所述中心频率和所述带宽限定的时间频率的频带作...

【专利技术属性】
技术研发人员:光藤祐基
申请(专利权)人:索尼公司
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1