当前位置: 首页 > 专利查询>索尼公司专利>正文

信号处理装置和方法以及程序制造方法及图纸

技术编号:22727513 阅读:10 留言:0更新日期:2019-12-04 07:49
本技术涉及用于使得能够更容易地获得适当的传播信息的信号处理装置、方法和程序。该信号处理装置设置有传播信息生成单元,该传播信息生成单元基于关于与音频对象的要处理的帧不同的其它帧的传播信息、缩放信息和关于音频对象的尺寸的信息中的任一信息以及音频对象的要处理的帧的对象位置信息,来生成关于音频对象的要处理的帧的传播信息。本技术可以应用于编码装置和解码装置。

Signal processing device, method and program

The technology relates to signal processing apparatus, methods and programs for making it easier to obtain appropriate propagation information. The signal processing apparatus is provided with a propagation information generating unit, which generates the propagation of the frame to be processed for the audio object based on the propagation information of other frames, scaling information, any information about the size of the audio object and the object position information of the frame to be processed for the audio object Information. The technology can be applied to encoding device and decoding device.

【技术实现步骤摘要】
【国外来华专利技术】信号处理装置和方法以及程序
本技术涉及信号处理装置和方法以及程序,并且更具体地,涉及使得能够更容易地获得适当的传播信息的信号处理装置和方法以及程序。
技术介绍
在相关技术中,例如,国际标准运动图像专家组(MPEG)-H部分3:3D音频标准等被称为可以处理对象音频的编码方案(例如,参见非专利文献1)。在这种编码方案中,可以执行传播音频对象的声音的声音图像的传播处理。具体地,在编码装置侧上,对象位置信息以及传播信息作为音频对象的元数据包括在比特流中,该对象位置信息指示音频对象的位置,该传播信息指示音频对象的声音的声音图像的传播程度。例如,在音频对象的声音的声音图像要在水平方向和垂直方向对称传播的情况下,传播信息包含指示从0度至180度的范围内的任何角度的单个值(在下文中,还被称为传播角),该值指示水平方向和垂直方向上的声音图像的传播程度。相反,在音频对象的声音的声音图像要在水平方向和垂直方向上不对称传播的情况下,传播信息包含指示水平方向上的传播角和垂直方向上的传播角的两个值。应注意,水平方向上的传播角和垂直方向上的传播角都采用从0度至180度的范围内的角度。这种传播信息可以采用音频对象的音频信号的每帧中的不同值。另外,在解码装置侧上,基于从比特流提取的传播信息执行传播音频对象的声音图像的渲染处理,或者换言之,传播处理。例如,如果执行这种传播处理,则可以放大附近对象的声音图像的区域,同时可以减少小型的并且远距离的对象的声音图像的区域。因此,可以实现感觉更逼真的内容再现。>引用列表非专利文献非专利文献1:国际标准ISO/IEC23008-3第一版2015-10-15信息技术-非均质分布环境中的高效编码和媒体传递-部分3:3D音频。
技术实现思路
本专利技术待解决的问题然而,不容易获得适当的传播信息。例如,将传播信息手动分配至每个时间(帧)和每个音频对象成本高。另外,根据情形,在一些情况下,传播信息甚至不能被分配。此外,如果由用户等在解码侧执行缩放处理,例如屏幕上的对象的尺寸改变,如果从比特流获得的传播信息照原样使用则声音图像的区域不可以传播适当尺寸。在这种情况下,屏幕上的对象的尺寸和对应于该对象的音频对象的声音图像的区域的尺寸将彼此不一致,并且将削弱真实感觉。已经按照这种情况设计了本技术,并且使得能够更容易地获得适当的传播信息。问题的解决方案根据本技术的一方面的信号处理装置包括:传播信息生成单元,被配置为基于与音频对象的要处理器的帧不同的其他帧中的传播信息、缩放信息和关于音频对象的尺寸信息中的任一信息以及音频对象的要处理的帧中的对象位置信息,来生成音频对象的要处理器的帧中的传播信息。传播信息生成单元可以基于音频对象的其他帧中的传播信息和要处理的帧中以及音频对象的其他帧中的对象位置信息,来生成要处理的帧中的传播信息。对象位置信息可以是从参考位置至音频对象的距离。传播信息生成单元可以生成要处理的帧中的距离和其他帧中的距离的比与其他帧中的传播信息的正切的乘积的反正切,作为要处理的帧中的传播信息。传播信息生成单元可以基于音频对象的要处理的帧中的缩放信息和传播信息,来生成缩放后的音频对象的要处理的帧中的传播信息。传播信息生成单元可以基于由缩放信息确定的缩放前的虚拟屏幕和缩放后的虚拟屏幕之间的位置和尺寸关系,来生成缩放后的音频对象的要处理的帧中的传播信息。传播信息生成单元可以基于音频对象的要处理的帧中的尺寸信息和对象位置信息,来生成要处理的帧中的传播信息。尺寸信息可以是从音频对象的中心至外壳(shell)的距离。对象位置信息可以是从参考位置至音频对象的距离。传播信息生成单元可以生成要处理的帧中的尺寸信息和对象位置信息的比的反正切,作为要处理的帧中的传播信息。根据本技术的一方面的信号处理方法或程序,包括:基于与音频对象的要处理器的帧不同的其他帧中的传播信息、缩放信息和关于音频对象的尺寸信息中的任一信息以及音频对象的要处理的帧中的对象位置信息,生成音频对象的要处理器的帧中的传播信息的步骤。在本技术的一方面中,基于与音频对象的要处理器的帧不同的其他帧中的传播信息、缩放信息和关于音频对象的尺寸信息中的任一信息以及音频对象的要处理的帧中的对象位置信息,生成音频对象的要处理器的帧中的传播信息。本专利技术的效果根据本技术的一方面,可以更容易地获得适当的传播信息。应注意,本文中描述的有益效果不必是限制性的,并且可以获得本公开中描述的任何有益效果。附图说明[图1]是说明了传播信息的生成的示图。[图2]是示出了编码装置的示例性配置的示图。[图3]是说明了编码处理的流程图。[图4]是示出了解码装置的示例性配置的示图。[图5]是说明了解码处理的流程图。[图6]是说明了传播信息的生成的示图。[图7]是说明了编码处理的流程图。[图8]是说明了解码处理的流程图。[图9]是说明了缩放的示图。[图10]是说明了根据缩放校正对象位置信息的示图。[图11]是示出了解码装置的示例性配置的示图。[图12]是说明了解码处理的流程图。[图13]是示出了计算机的示例性配置的示图。具体实施方式在下文中,将参考附图描述应用本技术的实施方式。<第一实施方式><关于本技术>本技术基于与要获得的传播信息不同的其他信息(诸如关于音频对象的对象位置信息、缩放信息、尺寸信息和不同时间的传播信息)通过生成关于音频对象的传播信息,使得能够更容易地获得适当的传播信息。在下文中,音频对象的多信息音频信号和一个音频信号被描述为根据预定标准等进行编码。应注意,在下文中,音频对象还简单地被称为对象。例如,针对每帧编码并发送每个信道和每个对象的音频信号。换言之,编码的音频信号和需要解码音频信号等的信息被存储在多个元素(比特流元素)中,并且包含这些元素的比特流从编码侧发送至解码侧。具体地,在单个帧的比特流中,例如,多个元素从头开始按顺序布置,并且指示与关于帧的信息相关的终端位置的标识符被布置在最后。此外,布置在开头的元素被当作称为数据流元素(DSE)的辅助数据区域。与多个信道中的每一个相关的信息(诸如与音频信号的下混合相关的信息以及识别信息)被称为DSE。另外,编码的音频信号被存储在跟在DSE之后的每个元素中。具体地,存储单信道的音频信号的元素被称为单信道元素(SCE),同时存储两个成对信道的音频信号的元素被称为耦合信道元素(CPE)。每个对象的音频信号被存储在SCE中。在本技术中,生成关于每个对象的音频信号的传播信息并存储在DSE中。更具体地,包括生成的传播信息的对象元数据被存储在DSE中。在本文中,元数据至少包含传播信息和对象位置信息。传播信息是指本文档来自技高网...

【技术保护点】
1.一种信号处理装置,包括:/n传播信息生成单元,被配置为基于与所述音频对象的要处理的帧不同的其他帧中的传播信息、缩放信息和所述音频对象的尺寸信息中的任一信息以及音频对象的要处理的帧中的对象位置信息,来生成所述音频对象的所述要处理的帧中的传播信息。/n

【技术特征摘要】
【国外来华专利技术】20170425 JP 2017-0859071.一种信号处理装置,包括:
传播信息生成单元,被配置为基于与所述音频对象的要处理的帧不同的其他帧中的传播信息、缩放信息和所述音频对象的尺寸信息中的任一信息以及音频对象的要处理的帧中的对象位置信息,来生成所述音频对象的所述要处理的帧中的传播信息。


2.根据权利要求1所述的信号处理装置,其中
所述传播信息生成单元基于所述音频对象的其他帧中的传播信息、所述音频对象的所述要处理的帧中的对象位置信息和所述其他帧中的对象位置信息,来生成所述要处理的帧的所述传播信息。


3.根据权利要求2所述的信号处理装置,其中
所述对象位置信息是从参考位置至所述音频对象的距离。


4.根据权利要求3所述的信号处理装置,其中
所述传播信息生成单元生成所述要处理的帧中的距离和所述其他帧中的距离的比与所述其他帧中的所述传播信息的正切的乘积的反正切,来作为所述要处理的帧的所述传播信息。


5.根据权利要求1所述的信号处理装置,其中
所述传播信息生成单元基于所述缩放信息和所述音频对象的要处理的帧中的传播信息,来生成缩放后的所述音频对象的要处理的帧中的传播信息。


6.根据权利要求5所述的信号处理装置,其中
所述传播信息生成单元基于由所述缩放信息确定的缩放前的虚拟...

【专利技术属性】
技术研发人员:山本优树知念徹辻实
申请(专利权)人:索尼公司
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1