沉浸式对象音频的压缩传输方法与架构技术

技术编号：21663855 阅读：40 留言：0更新日期：2019-07-20 06:59

本发明专利技术提供一种沉浸式对象音频的压缩传输方法与架构，其中，该方法包括以下步骤：服务器获取沉浸式对象音频；服务器基于预设的优化函数对多种压缩算法进行评价，确定最优压缩算法；服务器采用所述最优压缩算法对所述沉浸式对象音频进行压缩，获得压缩后的沉浸式对象音频；服务器将所述压缩后的沉浸式对象音频发送至客户端；客户端采用所述最优压缩算法对所述压缩后的沉浸式对象音频进行解压缩，获得所述沉浸式对象音频。本发明专利技术所提出的基于压缩‑解压缩的架构提高了沉浸式对象音频的压缩传输速率。

Compression Transmission Method and Architecture of Immersed Object Audio

全部详细技术资料下载

【技术实现步骤摘要】
沉浸式对象音频的压缩传输方法与架构
本专利技术涉及沉浸式音频的网络传输
，特别涉及一种沉浸式对象音频的压缩传输方法与架构。
技术介绍
音频压缩技术属于数据压缩的一种，这种技术可以减少音频文件的大小，并降低音频流传输的带宽需求。音频压缩方法通常可以被分为无损压缩和有损压缩两类。无损音频压缩是一个可逆的过程，此类方法利用音频中的冗余信息对数据进行压缩。无损压缩方法减小了音频的文件大小，但压缩后的文件保留所有原始音频信息，播放效果与原始音频文件完全一致。常见的无损压缩技术有APE、FLAC、ALAC等。有损音频压缩方法通常对原始文件的某些不重要信息做近似处理，以得到更小的压缩文件，压缩后文件大小约为原本的百分之五至百分之二十。但有损压缩是一个不可逆的压缩过程。有损压缩方法将心理学、人类听觉系统等因素纳入音频压缩的考量之中。这类压缩方法在理论上损失了原始文件中的部分信息，但这类信息的损失不一定能被人耳清晰分辨。最常见的有损音频压缩技术有ADPCM、WMA、MP3、AAC、AC3、OGG、Opus等。有损音频压缩通常采用改进的离散余弦变换(ModifiedDiscreteCosineTransform,MDCT)对音频文件进行压缩，并利用人类的听觉掩蔽以及听觉阈特性，舍弃不重要的声音信息。沉浸式音频重新定义了音频后期制作的思维方式。杜比全景声、Auro3D、DTS:X等技术通过引入高维空间坐标系，为观众提供了更好的立体音频体验。对象音频不再将立体音频视为简单的多声道表示，而是将音频在三维空间中进行重构，对象音频在三维空间的理论点定位声音，并在空间中建立虚拟音频...

【技术保护点】
1.一种沉浸式对象音频的压缩传输方法，其特征在于，包括：服务器获取沉浸式对象音频；服务器基于预设的优化函数对多种压缩算法进行评价，确定最优压缩算法；服务器采用所述最优压缩算法对所述沉浸式对象音频进行压缩，获得压缩后的沉浸式对象音频；服务器将所述压缩后的沉浸式对象音频发送至客户端；客户端采用所述最优压缩算法对所述压缩后的沉浸式对象音频进行解压缩，获得所述沉浸式对象音频。

【技术特征摘要】
1.一种沉浸式对象音频的压缩传输方法，其特征在于，包括：服务器获取沉浸式对象音频；服务器基于预设的优化函数对多种压缩算法进行评价，确定最优压缩算法；服务器采用所述最优压缩算法对所述沉浸式对象音频进行压缩，获得压缩后的沉浸式对象音频；服务器将所述压缩后的沉浸式对象音频发送至客户端；客户端采用所述最优压缩算法对所述压缩后的沉浸式对象音频进行解压缩，获得所述沉浸式对象音频。2.如权利要求1所述的沉浸式对象音频的压缩传输方法，其特征在于，服务器为多个，包括一个主服务器和多个从服务器；其中，主服务器获取沉浸式对象音频，根据应用场景对所述沉浸式对象音频进行下混音，将下混音后的沉浸式对象音频根据从服务器的数量进行分块，将分块后的下混音后的沉浸式对象音频发送至对应的从服务器；从服务器基于预设的优化函数对多种压缩算法进行评价，确定最优压缩算法，采用所述最优压缩算法对所述分块后的下混音后的沉浸式对象音频进行压缩，获得压缩后的沉浸式对象音频，将所述压缩后的沉浸式对象音频发送至客户端。3.如权利要求1所述的沉浸式对象音频的压缩传输方法，其特征在于，服务器基于预设的优化函数对多种压缩算法进行评价，确定最优压缩算法，包括：服务器基于正交分解将所述沉浸式对象音频划分为多个频带；对于每个频带，基于预设的优化函数对多种压缩算法进行评价，确定最优压缩算法。4.如权利要求3所述的沉浸式对象音频的压缩传输方法，其特征在于，所述优化函数为：其中，cfixed为网络带宽所允许最大存储空间；pfixed为计算过程的最大功耗；Dfixed为所允许的最大的延迟；cj为第j个频段的存储空间；pj为第j个频段计算时的功耗；dj为第j个频段计算所产生的延迟；k为傅里叶变换的频点数目；W＝{w1,w2,…,wk}为各频点的权值；Scompress为压缩后的音频频谱；为原始音频频谱；为各频点压缩后的损失函数。5.一种沉浸式对象音频的压缩传输方法，其特征在于，包括：获取沉浸式对象音频；基于预设的优化函数对多种压缩算法进行评价，确定最优压缩算法；采用所述最优压缩算法对所述沉浸式对象音频进行压缩，获得压缩后的沉浸式对象音频；将所述压缩后的沉浸式对象音频发送至客户端。6.如权利要求5所述的沉浸式对象音频的压缩传输方法，其特征在于，还包括：根据应用场景对所述沉浸式...

【专利技术属性】
技术研发人员：马士超，姜珊珊，郑天垚，
申请(专利权)人：雷欧尼斯北京信息技术有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人