嵌入和获取声源定向信息的方法及音频编解码方法和系统技术方案

技术编号：3842428 阅读：234 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种在码流中嵌入声源定向信息的方法、一种音频数据的压缩编码方法、一种音频数据的解码方法、一种音频数据的压缩编解码方法，以及一种音频数据的压缩编解码系统。本发明专利技术可以将声源定向信息进行编码后添加至音频单声道数据码流的头语法结构中，从而能够实现将声源定向信息嵌入至码流中，以使得声源定向信息随码流传输。如此一来，将本发明专利技术的技术方案应用于监控场景中，就无需在监控前端和监控后端之间传输或存储多声道音频数据的码流，从而避免了监控前端输出多声道音频数据的码流而使得监控后端难以获得准确声源定向信息的问题，而且还避免了多声道音频数据的码流传输或存储占用较大传输带宽或存储空间。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及音频数据的编解码技术，特别涉及一种在码流中嵌入声源定向信息的方法、一种从码流中获取声源定向信息的方法，还涉及一种音频压缩编解码方法和一种音频压缩编解码系统。
技术介绍
在现有的某些监控场景中，通常会在监控前端利用麦克风阵列来采集音频多声道数据，然后利用麦克风阵列算法对音频多声道数据进行去噪、定位等处理，得到音频单声道数据和声源定向信息。此后，即可基于现有的音频压缩编码标准，将音频单声道数据压缩编码、并生成码流后传输至监控后端，并由监控后端解码后播放。此外，声源定向信息也可供监控后端控制监控场景中的摄像头转动和/或移动，以实现对监控目标的跟踪。然而，现有的音频压缩编码标准并不支持在码流中传输声源定向信息，从而使得声源定向信息无法由监控前端传输至监控后端。为了解决上述问题，现有技术则直接将麦克风阵列采集的音频多声道数据压缩编码、并生成码流后传输至监控后端，并由监控解码后利用麦克风阵列算法对音频多声道数据进行去噪、定位等处理，以得到声源定向信息。但由于多声道音频数据中各声道的相位关系会在监控前端的压缩编码过程中被破坏，从而使得监控后端无...

【技术保护点】
一种在码流中嵌入声源定向信息的方法，其特征在于，该方法包括：接收音频单声道数据、及对应的声源定向信息；将所述音频单声道数据压缩编码形成码流、并在所述码流中各帧的头语法结构内添加码流信息的同时，还将所述声源定向信息编码后添加至任意一帧或多帧的所述头语法结构内。

【技术特征摘要】

【专利技术属性】
技术研发人员：冯宇红，张晨，邱嵩，
申请(专利权)人：北京中星微电子有限公司，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人