当前位置: 首页 > 专利查询>索尼公司专利>正文

信号处理装置和方法以及程序制造方法及图纸

技术编号:24335097 阅读:75 留言:0更新日期:2020-05-29 21:57
本技术涉及能够更有效控制距离感的信号处理装置和方法以及程序。信号处理装置包括混响处理单元,用于基于音频对象的对象音频数据和关于音频对象的混响参数来生成混响分量的信号。本技术可应用于信号处理装置。

Signal processing device, method and program

【技术实现步骤摘要】
【国外来华专利技术】信号处理装置和方法以及程序
本技术涉及信号处理装置、信号处理方法和程序,尤其涉及能够实现更有效的距离感控制的信号处理装置、信号处理方法和程序。
技术介绍
近年来,基于对象的音频技术已经备受关注。在基于对象的音频中,音频数据由关于对象的波形信号和元数据来配置,该元数据指示由相对于作为预定基准的视/听点的位置所表示的对象的定位信息。然后,基于元数据,通过例如基于矢量的振幅平移(VectorBasedAmplitudePanning,VBAP)将对象的波形信号渲染为期望声道数的信号并进行再生(例如,参见非专利文献1和非专利文献2)。现有技术文献非专利文献非专利文献1:ISO/IEC23008-3Informationtechnology-Highefficiencycodingandmediadeliveryinheterogeneousenvironments-Part3:3Daudio非专利文献2:VillePulkki,“VirtualSoundSourcePositioningUsingVectorBaseAmplitudePanning”,JournalofAES,vol.45,no.6,pp.456-466,1997
技术实现思路
本专利技术要解决的问题利用上述方法,在渲染基于对象的音频时,可以在三维空间中的各个方向上布置每个对象并且定位声音。然而,难以有效地实现音频对象的距离感控制。即,例如,在再生对象的声音时期望生成前后距离感的情况下,必须通过增益控制或频率特性控制来生成距离感,并且不能获得足够的效果。此外,尽管可以使用先前经处理以具有生成距离感的声音质量的波形信号,但是在这种情况下,不能在再生侧控制距离感。已经开发了本技术来解决上述这些问题,并且更有效地实现距离感控制。问题的解决方案根据本技术的一个方面的信号处理装置包括混响处理单元,其基于音频对象的对象音频数据和关于音频对象的混响参数来生成混响分量的信号。根据本技术的一个方面的信号处理方法或程序包括以下步骤:基于音频对象的对象音频数据和关于音频对象的混响参数来生成混响分量的信号。在本技术的一个方面中,基于音频对象的对象音频数据和关于音频对象的混响参数来生成混响分量的信号。本专利技术的效果根据本技术的一个方面,可以更有效地实现距离感控制。注意,这里描述的效果不必受到限制,并且可以是本公开中描述的任何效果。附图说明[图1]是示出信号处理装置的配置示例的图。[图2]是示出混响参数的示例的图。[图3]是描述湿分量位置信息和湿分量(Wetcomponent)的声像定位的图。[图4]是描述湿分量位置信息和湿分量的声像定位的图。[图5]是描述音频信号输出处理的流程图。[图6]是示出信号处理装置的配置示例的图。[图7]是示出元信息的语法示例的图。[图8]是描述音频信号输出处理的流程图。[图9]是示出信号处理装置的配置示例的图。[图10]是描述参数混响的配置元件的图。[图11]是示出元信息的语法示例的图。[图12]是示出Reverb_Configuration()(混响_配置())的语法示例的图。[图13]是示出Reverb_Structure()(混响_结构())的语法示例的图。[图14]是示出Branch_Configuration(n)(分支_配置(n))的语法示例的图。[图15]是示出PreDelay_Configuration()(预延迟_配置())的语法示例的图。[图16]是示出MultiTapDelay_Configuration()(多抽头延迟_配置())的语法示例的图。[图17]是示出AllPassFilter_Configuration()(全通滤波器_配置())的语法示例的图。[图18]是示出CombFilter_Configuration()(梳状滤波器_配置())的语法示例的图。[图19]是示出HighCut_Configuration()(高截止_配置())的语法示例的图。[图20]是示出Reverb_Parameter()(混响_参数())的语法示例的图。[图21]是示出Branch_Parameters(n)(分支_参数(n))的语法示例的图。[图22]是示出PreDelay_Parameters()(预延迟_参数())的语法示例的图。[图23]是示出MultiTapDelay_Parameters()(多抽头延迟_参数())的语法示例的图。[图24]是示出HighCut_Parameters()(高截止_参数())的语法示例的图。[图25]是示出AllPassFilter_Parameters()(全通滤波器_参数())的语法示例的图。[图26]是示出CombFilter_Parameters()(梳状滤波器_参数())的语法示例的图。[图27]是示出元信息的语法示例的图。[图28]是描述音频信号输出处理的流程图。[图29]是示出信号处理装置的配置示例的图。[图30]是示出元信息的语法示例的图。[图31]是示出计算机的配置示例的图。具体实施方式在下文中,将参照附图描述应用本技术的实施例。<第一实施例><关于本技术>本技术旨在通过基于参数添加声音的反射分量或混响分量来更有效地实现距离感控制。即,本技术特别具有以下特征。特征(1)通过基于关于对象的混响设置参数添加反射/混响分量来实现距离感控制。特征(2)反射/混响分量被定位到与对象的声像的位置不同的位置。特征(3)反射/混响分量的位置信息由相对于目标对象的声像的定位位置的相对位置来指定。特征(4)反射/混响分量的位置信息被固定地指定,而与目标对象的声像的定位位置无关。特征(5)将添加到对象的混响处理的脉冲响应作为元信息,在渲染时,通过利用基于元信息的滤波处理添加反射/混响分量来实现距离感控制。特征(6)提取待应用的混响处理算法的配置信息和系数。特征(7)将混响处理算法的配置信息和系数参数化并且用作元信息。特征(8)基于元信息,通过在再生侧重新配置混响处理算法并且在基于对象的音频的渲染中添加混响分量来实现距离感控制。例如,当人感知声音时,不仅听到来自声源的直达声,而且听到来自墙壁等的反射声或混响声,并且通过直达声与反射声或混响声之间的音量差或时间差感觉到距声源的距离。因此,在音频对象的渲染中,通过利用混响处理添加反射声或混响声,或者通过控制直达声与反射声或混响声之间的时间差或增益差,可以对音频对象的声音创建距本文档来自技高网...

【技术保护点】
1.一种信号处理装置,包括:/n混响处理单元,基于音频对象的对象音频数据和关于所述音频对象的混响参数生成混响分量的信号。/n

【技术特征摘要】
【国外来华专利技术】20171020 JP 2017-2038761.一种信号处理装置,包括:
混响处理单元,基于音频对象的对象音频数据和关于所述音频对象的混响参数生成混响分量的信号。


2.根据权利要求1所述的信号处理装置,还包括:
渲染处理单元,基于所述混响参数对所述混响分量的信号执行渲染处理。


3.根据权利要求2所述的信号处理装置,
其中,所述混响参数包括指示所述混响分量的声像的定位位置的位置信息,以及
所述渲染处理单元基于所述位置信息执行所述渲染处理。


4.根据权利要求3所述的信号处理装置,
其中,所述位置信息包括指示所述混响分量的声像的绝对定位位置的信息。


5.根据权利要求3所述的信号处理装置,
其中,所述位置信息包括指示所述混响分量的声像的相对于所述音频对象的相对定位位置的信息。


6.根据权利要求1所述的信号处理装置,
其中,所述混响参数包括脉冲响应,以及
所述混响处理单元基于所述脉...

【专利技术属性】
技术研发人员:辻实知念徹福井隆郎畠中光行
申请(专利权)人:索尼公司
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1