声源定向信息的编解码方法和系统技术方案

技术编号：3842425 阅读：256 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种声源定向信息的编码方法、一种声源定向信息的解码方法、一种声源定向信息的编解码方法、以及一种声源定向信息的编解码系统。本发明专利技术可以将当前帧所对应的每个方向的角度信息分别与前一帧中对应的同一方向的角度信息进行差分运算，得到每个方向的差分运算结果；然后对取值过大的差分运算结果进行低精度的量化处理，对于取值较小的差分运算结果进行高精度的量化处理，从而实现对声源定向信息的编码。如此一来，只要将声源定向信息编码后携带于当前帧的头语法结构中，即可随码流传输，从而实现准确的声源定位。而且，对于取值过大的差分运算结果，本发明专利技术还可补偿量化该方向的差分运算结果时产生的误差。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及音频数据的编解码技术，特别涉及一种声源定向信息的编码方法、一种声源定向信息的解码方法、一种声源定向信息的编解码方法、以及一种声源定向信息的编解码系统。
技术介绍
在现有的某些监控场景中，通常会在监控前端利用麦克风阵列来采集音频多声道数据，然后利用麦克风阵列算法对音频多声道数据进行去噪、定位等处理，得到音频单声道数据和声源定向信息。此后，即可基于现有的音频压缩编码标准，将音频单声道数据压缩编码、并生成码流后传输至监控后端，并由监控后端解码后播放。而声源定向信息则可供监控后端进行声源定位，用来控制监控场景中的摄像头转动和/或移动，以实现对监控目标的跟踪。然而，现有的音频压缩编码标准并不支持在码流中传输声源定向信息，从而使得声源定向信息无法由监控前端传输至监控后端。为了解决上述问题，现有技术则直接将麦克风阵列采集的音频多声道数据压缩编码、并生成码流后传输至监控后端，并由监控解码后利用麦克风阵列算法对音频多声道数据进行去噪、定位等处理，以得到声源定向信息。但由于多声道音频数据中各声道的相位关系会在监控前端的压缩编码过程中被破坏，从而使得监...

【技术保护点】
一种声源定向信息的编码方法，所述声源定向信息包括各音频数据帧对应的任意方向上的角度信息，其特征在于，该编码方法包括：ｃ１、将当前帧所对应的每个方向的角度信息分别与前一帧中对应的同一方向的角度信息进行差分运算，得到每个方向的第三差分运算结果；ｃ２０、判断每个方向的第三差分运算结果的取值是否位于预定的角度范围之外，如果是，则顺序执行步骤ｃ２１和步骤ｃ３１；否则，顺序执行步骤ｃ２２和步骤ｃ３２；ｃ２１、设定该方向对应的编码级别为第一编码级别，利用第一级角度精度量化该方向的第三差分运算结果，得到该方向的第四差分运算结果、并将该方向的第四差分运算结果确定为该方向角度信息编码后的结果；ｃ３１、利用第四差分...

【技术特征摘要】

【专利技术属性】
技术研发人员：张晨，冯宇红，
申请(专利权)人：北京中星微电子有限公司，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人