一种声音对象的编码方法技术

技术编号：13601276 阅读：89 留言：0更新日期：2016-08-27 16:27

本发明专利技术公开了一种声音对象的编码方法，包括：获取声场空间的声音对象；以声场空间水平切面中心、与录音师双耳连线中心等高的位置为原点建立三维坐标系；将声音对象的位置轨迹以帧为单位划分，每帧分为若干块；确定声音对象第i块的位置坐标为（x(i)，y(i)，z(i)）；确定声音对象的作用区域为（φ，θ，γ），其中φ为声音对象和原点连线在xoy平面上的投影与x轴的夹角、范围[0，2π)，θ为声音对象和原点连线与z轴的夹角，γ是锥面张开大小的、定义为锥面母线和中轴线的夹角，范围[0，π/2]。本发明专利技术提供的声音对象的编码方法，将声音对象的坐标（x、y、z）和有效作用区域（φ，θ，γ）统一到一个坐标系统，实现更高效率的空间表示和更好的声场效果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及声音编码
，具体涉及一种声音对象的编码方法。
技术介绍
随着计算能力和网络的快速发展，在电影、电视、音乐、游戏、虚拟现实和网络视频等应用领域，能表现真实三维声场的音频录制、缩混编辑、编码、解码、渲染和回放技术，有着重要的应用价值。“全景声”是对三维声场的形象描述。目前，MPEG推出了MPEG H的三维声编码技术，Dolby公司推出了Atmos全景声编码技术，都在传统多声道信号编码的基础上，提出了声音对象编码的概念。其中，Dolby Atmos采用直接记录声音对象的三维运动轨迹的方式，对声音对象的三维坐标(x、y、z)进行编码，并且对声音对象的渲染和回放方式，划分为9个矩形区域。MPEG H则不直接对声音对象编码，而是采用参数立体声的编码技术，将多个声音混合成一个单声道信号，并对每个声音对象的空间感知信息(相位、强度和相关性)编码；在解码时，先解码单声道和信号，再利用声音对象的空间感知信息，恢复出每个声音对象。在高质量应用场合，如电影等领域，Dolby Atmos能够获得比MPEG H更高的声音质量。但是Dolby Atmos的空间坐标体系、坐...

【技术保护点】
一种声音对象的编码方法，其特征在于，包括：获取声场空间的声音对象；以声场空间水平切面中心、与录音师双耳连线中心等高的位置为原点建立三维坐标系；将声音对象的位置轨迹以帧为单位划分，每帧分为若干块；确定声音对象第i块的位置坐标为（x(i)，y(i)，z(i)）；位置坐标（x，y，z）映射为（pID，Ax，Ay，Az），pID为象限标识符，Ax、Ay、Az为位置坐标的绝对值。

【技术特征摘要】
1.一种声音对象的编码方法，其特征在于，包括：获取声场空间的声音对象；以声场空间水平切面中心、与录音师双耳连线中心等高的位置为原点建立三维坐标系；将声音对象的位置轨迹以帧为单位划分，每帧分为若干块；确定声音对象第i块的位置坐标为（x(i)，y(i)，z(i)）；位置坐标（x，y，z）映射为（pID，Ax，Ay，Az），pID为象限标识符，Ax、Ay、Az为位置坐标的绝对值。2.根据权利要求1所述声音对象的编码方法，其特征在于：所述声音对象的作用区域为（φ，θ，γ），其中φ为声音对象和原点连线在xoy平面上的投影与x轴的夹角、范围[0，2π)，θ为声音对象和原点连线与z轴的夹角，γ是描述锥面...

【专利技术属性】
技术研发人员：潘兴德，吴超刚，
申请(专利权)人：南京青衿信息科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人