【技术实现步骤摘要】
本专利技术涉及声音编码
,具体涉及一种声音对象的编码方法。
技术介绍
随着计算能力和网络的快速发展,在电影、电视、音乐、游戏、虚拟现实和网络视频等应用领域,能表现真实三维声场的音频录制、缩混编辑、编码、解码、渲染和回放技术,有着重要的应用价值。“全景声”是对三维声场的形象描述。目前,MPEG推出了MPEG H的三维声编码技术,Dolby公司推出了Atmos全景声编码技术,都在传统多声道信号编码的基础上,提出了声音对象编码的概念。其中,Dolby Atmos采用直接记录声音对象的三维运动轨迹的方式,对声音对象的三维坐标(x、y、z)进行编码,并且对声音对象的渲染和回放方式,划分为9个矩形区域。MPEG H则不直接对声音对象编码,而是采用参数立体声的编码技术,将多个声音混合成一个单声道信号,并对每个声音对象的空间感知信息(相位、强度和相关性)编码;在解码时,先解码单声道和信号,再利用声音对象的空间感知信息,恢复出每个声音对象。在高质量应用场合,如电影等领域,Dolby Atmos能够获得比MPEG H更高的声音质量。但是Dolby Atmos的空间坐标体系、坐 ...
【技术保护点】
一种声音对象的编码方法,其特征在于,包括:获取声场空间的声音对象;以声场空间水平切面中心、与录音师双耳连线中心等高的位置为原点建立三维坐标系;将声音对象的位置轨迹以帧为单位划分,每帧分为若干块;确定声音对象第i块的位置坐标为(x(i),y(i),z(i));位置坐标(x,y,z)映射为(pID,Ax,Ay,Az),pID为象限标识符,Ax、Ay、Az为位置坐标的绝对值。
【技术特征摘要】
1.一种声音对象的编码方法,其特征在于,包括:获取声场空间的声音对象;以声场空间水平切面中心、与录音师双耳连线中心等高的位置为原点建立三维坐标系;将声音对象的位置轨迹以帧为单位划分,每帧分为若干块;确定声音对象第i块的位置坐标为(x(i),y(i),z(i));位置坐标(x,y,z)映射为(pID,Ax,Ay,Az),pID为象限标识符,Ax、Ay、Az为位置坐标的绝对值。2.根据权利要求1所述声音对象的编码方法,其特征在于:所述声音对象的作用区域为(φ,θ,γ),其中φ为声音对象和原点连线在xoy平面上的投影与x轴的夹角、范围[0,2π),θ为声音对象和原点连线与z轴的夹角,γ是描述锥面...
【专利技术属性】
技术研发人员:潘兴德,吴超刚,
申请(专利权)人:南京青衿信息科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。