沉浸式对象音频的压缩传输方法与架构技术

技术编号:21663855 阅读:40 留言:0更新日期:2019-07-20 06:59
本发明专利技术提供一种沉浸式对象音频的压缩传输方法与架构,其中,该方法包括以下步骤:服务器获取沉浸式对象音频;服务器基于预设的优化函数对多种压缩算法进行评价,确定最优压缩算法;服务器采用所述最优压缩算法对所述沉浸式对象音频进行压缩,获得压缩后的沉浸式对象音频;服务器将所述压缩后的沉浸式对象音频发送至客户端;客户端采用所述最优压缩算法对所述压缩后的沉浸式对象音频进行解压缩,获得所述沉浸式对象音频。本发明专利技术所提出的基于压缩‑解压缩的架构提高了沉浸式对象音频的压缩传输速率。

Compression Transmission Method and Architecture of Immersed Object Audio

【技术实现步骤摘要】
沉浸式对象音频的压缩传输方法与架构
本专利技术涉及沉浸式音频的网络传输
,特别涉及一种沉浸式对象音频的压缩传输方法与架构。
技术介绍
音频压缩技术属于数据压缩的一种,这种技术可以减少音频文件的大小,并降低音频流传输的带宽需求。音频压缩方法通常可以被分为无损压缩和有损压缩两类。无损音频压缩是一个可逆的过程,此类方法利用音频中的冗余信息对数据进行压缩。无损压缩方法减小了音频的文件大小,但压缩后的文件保留所有原始音频信息,播放效果与原始音频文件完全一致。常见的无损压缩技术有APE、FLAC、ALAC等。有损音频压缩方法通常对原始文件的某些不重要信息做近似处理,以得到更小的压缩文件,压缩后文件大小约为原本的百分之五至百分之二十。但有损压缩是一个不可逆的压缩过程。有损压缩方法将心理学、人类听觉系统等因素纳入音频压缩的考量之中。这类压缩方法在理论上损失了原始文件中的部分信息,但这类信息的损失不一定能被人耳清晰分辨。最常见的有损音频压缩技术有ADPCM、WMA、MP3、AAC、AC3、OGG、Opus等。有损音频压缩通常采用改进的离散余弦变换(ModifiedDiscreteCosineTransform,MDCT)对音频文件进行压缩,并利用人类的听觉掩蔽以及听觉阈特性,舍弃不重要的声音信息。沉浸式音频重新定义了音频后期制作的思维方式。杜比全景声、Auro3D、DTS:X等技术通过引入高维空间坐标系,为观众提供了更好的立体音频体验。对象音频不再将立体音频视为简单的多声道表示,而是将音频在三维空间中进行重构,对象音频在三维空间的理论点定位声音,并在空间中建立虚拟音频模型。基于对象的混音的本质是一种高分辨率音频模型,可根据虚拟音源的位置适应音箱布局,并保持与传统环绕声环境的向后兼容性。伴随着沉浸式音频技术的不断发展,沉浸式音频的应用领域日益广泛,音频质量不断提高,对沉浸式音频传输技术的需求也日益增加。传统的沉浸式对象音频传输方法直接传输对象音频,传输速率较慢且不能实时播放,对不同类型的场景的适应性较差。
技术实现思路
本专利技术实施例提供了一种沉浸式对象音频的压缩传输方法与架构,解决了现有技术中直接传输对象音频传输速率较慢且不能实时播放,对不同类型的场景的适应性较差的技术问题。第一方面,该沉浸式对象音频的压缩传输方法包括:服务器获取沉浸式对象音频;服务器基于预设的优化函数对多种压缩算法进行评价,确定最优压缩算法;服务器采用所述最优压缩算法对所述沉浸式对象音频进行压缩,获得压缩后的沉浸式对象音频;服务器将所述压缩后的沉浸式对象音频发送至客户端;客户端采用所述最优压缩算法对所述压缩后的沉浸式对象音频进行解压缩,获得所述沉浸式对象音频。第二方面,该沉浸式对象音频的压缩传输方法包括:获取沉浸式对象音频;基于预设的优化函数对多种压缩算法进行评价,确定最优压缩算法;采用所述最优压缩算法对所述沉浸式对象音频进行压缩,获得压缩后的沉浸式对象音频;将所述压缩后的沉浸式对象音频发送至客户端。第三方面,该沉浸式对象音频的压缩传输架构包括:服务器和客户端;其中,所述服务器用于:获取沉浸式对象音频;基于预设的优化函数对多种压缩算法进行评价,确定最优压缩算法;采用所述最优压缩算法对所述沉浸式对象音频进行压缩,获得压缩后的沉浸式对象音频;将所述压缩后的沉浸式对象音频发送至客户端。所述客户端用于:采用所述最优压缩算法对所述压缩后的沉浸式对象音频进行解压缩,获得所述沉浸式对象音频。第四方面,该沉浸式对象音频的压缩传输架构包括:沉浸式对象音频获取模块,用于获取沉浸式对象音频;最优压缩算法确定模块,用于基于预设的优化函数对多种压缩算法进行评价,确定最优压缩算法;沉浸式对象音频压缩模块,用于采用所述最优压缩算法对所述沉浸式对象音频进行压缩,获得压缩后的沉浸式对象音频;沉浸式对象音频传输模块,用于将所述压缩后的沉浸式对象音频发送至客户端。第五方面,本专利技术实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述所述方法。第六方面,本专利技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述所述方法的计算机程序。在本专利技术实施例中,基于预设的优化函数对多种压缩算法进行评价,确定最优压缩算法,通过优压缩算法对沉浸式对象音频进行压缩,然后将压缩后的沉浸式对象音频发送至客户端,客户端采用最优压缩算法对所述压缩后的沉浸式对象音频进行解压缩,获得所述沉浸式对象音频。与传统的沉浸式对象音频传输方法相比较,本专利技术不直接传输对象音频,而是传输的压缩后的沉浸式对象音频,这样提高了传输速率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种沉浸式对象音频的压缩传输方法(服务器和客户端整体)流程图;图2是本专利技术实施例提供的一种从沉浸式对象音频的压缩传输方法(服务器和客户端整体)角度说明的沉浸式对象音频的分布式存储与计算方案流程图;图3是本专利技术实施例提供的一种从沉浸式对象音频的压缩传输方法(服务器和客户端整体)角度说明的压缩方案的自适应选择方法流程图;图4是本专利技术实施例提供的一种对象音频的传输流程图;图5是本专利技术实施例提供的一种沉浸式对象音频的压缩传输架构(服务器和客户端整体)框图;图6是本专利技术实施例提供的一种沉浸式对象音频的压缩传输方法(服务器端)流程图;图7是本专利技术实施例提供的一种从沉浸式对象音频的压缩传输方法(服务器端)角度说明的沉浸式对象音频分布式存储与计算方案流程图;图8是本专利技术实施例提供的一种从沉浸式对象音频的压缩传输方法(服务器端)角度说明的压缩方案的自适应选择方法流程图;图9是本专利技术实施例提供的一种沉浸式对象音频的压缩传输架构(服务器端)框图(一);图10是本专利技术实施例提供的一种沉浸式对象音频的压缩传输架构(服务器端)框图(二);图11是本专利技术实施例提供的一种沉浸式对象音频的压缩传输架构(服务器端)框图(三)。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。在本专利技术实施例中,提供了一种沉浸式对象音频的压缩传输方法,如图1所示,该方法包括:步骤101:服务器获取沉浸式对象音频;步骤102:服务器基于预设的优化函数对多种压缩算法进行评价,确定最优压缩算法;步骤103:服务器采用所述最优压缩算法对所述沉浸式对象音频进行压缩,获得压缩后的沉浸式对象音频;步骤104:服务器将所述压缩后的沉浸式对象音频发送至客户端;步骤105:客户端采用所述最优压缩算法对所述压缩后的沉浸式对象音频进行解压缩,获得所述沉浸式对象音频。在本专利技术实施例中,传统的沉浸式对象音频传输方法采用集中存储、串行计算的方案,压缩速度慢,且计算时间长,不利于沉浸本文档来自技高网
...

【技术保护点】
1.一种沉浸式对象音频的压缩传输方法,其特征在于,包括:服务器获取沉浸式对象音频;服务器基于预设的优化函数对多种压缩算法进行评价,确定最优压缩算法;服务器采用所述最优压缩算法对所述沉浸式对象音频进行压缩,获得压缩后的沉浸式对象音频;服务器将所述压缩后的沉浸式对象音频发送至客户端;客户端采用所述最优压缩算法对所述压缩后的沉浸式对象音频进行解压缩,获得所述沉浸式对象音频。

【技术特征摘要】
1.一种沉浸式对象音频的压缩传输方法,其特征在于,包括:服务器获取沉浸式对象音频;服务器基于预设的优化函数对多种压缩算法进行评价,确定最优压缩算法;服务器采用所述最优压缩算法对所述沉浸式对象音频进行压缩,获得压缩后的沉浸式对象音频;服务器将所述压缩后的沉浸式对象音频发送至客户端;客户端采用所述最优压缩算法对所述压缩后的沉浸式对象音频进行解压缩,获得所述沉浸式对象音频。2.如权利要求1所述的沉浸式对象音频的压缩传输方法,其特征在于,服务器为多个,包括一个主服务器和多个从服务器;其中,主服务器获取沉浸式对象音频,根据应用场景对所述沉浸式对象音频进行下混音,将下混音后的沉浸式对象音频根据从服务器的数量进行分块,将分块后的下混音后的沉浸式对象音频发送至对应的从服务器;从服务器基于预设的优化函数对多种压缩算法进行评价,确定最优压缩算法,采用所述最优压缩算法对所述分块后的下混音后的沉浸式对象音频进行压缩,获得压缩后的沉浸式对象音频,将所述压缩后的沉浸式对象音频发送至客户端。3.如权利要求1所述的沉浸式对象音频的压缩传输方法,其特征在于,服务器基于预设的优化函数对多种压缩算法进行评价,确定最优压缩算法,包括:服务器基于正交分解将所述沉浸式对象音频划分为多个频带;对于每个频带,基于预设的优化函数对多种压缩算法进行评价,确定最优压缩算法。4.如权利要求3所述的沉浸式对象音频的压缩传输方法,其特征在于,所述优化函数为:其中,cfixed为网络带宽所允许最大存储空间;pfixed为计算过程的最大功耗;Dfixed为所允许的最大的延迟;cj为第j个频段的存储空间;pj为第j个频段计算时的功耗;dj为第j个频段计算所产生的延迟;k为傅里叶变换的频点数目;W={w1,w2,…,wk}为各频点的权值;Scompress为压缩后的音频频谱;为原始音频频谱;为各频点压缩后的损失函数。5.一种沉浸式对象音频的压缩传输方法,其特征在于,包括:获取沉浸式对象音频;基于预设的优化函数对多种压缩算法进行评价,确定最优压缩算法;采用所述最优压缩算法对所述沉浸式对象音频进行压缩,获得压缩后的沉浸式对象音频;将所述压缩后的沉浸式对象音频发送至客户端。6.如权利要求5所述的沉浸式对象音频的压缩传输方法,其特征在于,还包括:根据应用场景对所述沉浸式...

【专利技术属性】
技术研发人员:马士超姜珊珊郑天垚
申请(专利权)人:雷欧尼斯北京信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1