【技术实现步骤摘要】
本专利技术涉及多媒体领域,具体涉及一种声源分离技术方案,从单声道、立体声、或者多声道音频信号中分离出独立的声源。
技术介绍
音频信号,特别是音乐信号,通常包含多个声源,例如人声、各个伴奏乐器声、以及环境声。如何有效的从混合的音频信号中提取各个独立的声源是一个重要的理论问题,也是一个重要的应用问题。在卡拉OK中,人声部分需要被部分或完全消除;在移动通话中,环境噪音需要被尽可能的消除以提高通话质量;在主动音乐欣赏(Active Listening ofMusic)中,各个乐器声需要不同的增益和相位调整以合成用户期待的空间音场。在上述应用中,声源分离都是关键性的技术。声源分离系统可以分为两大类,一类是盲声源分离(Blind Source Separation)系统,另一类是有参考信息的声源分离(Informed Source Separation)系统。前者一般仅基于对声源统计特性的基本假设,例如高斯分布或者稀疏分布,而不需要参考信息协助分离声源。后者则需要占据一定带宽(比特率)的参考信息以协助分离声源。盲声源分离系统相对有参考信息的声源分离系统具有更广泛的适应性并且 ...
【技术保护点】
一种用于声源分离的编码方法,其特征在于:对参考信息进行编码,包括获取每个声源和下混信号每个声道的时频变换系数,并按帧和频率排列构成二维时频图;根据活跃声源数遍历每一种活跃声源的组合方案并求得对应的备选解;计算各备选解的失真,取失真最小的备选解所对应的组合的标号作为声源分离的参考信息;根据下混信号判定参考信息的重要性;根据重要性重新组织参考信息;最后对重新组织的参考信息进行熵编码得到参考信息码流。
【技术特征摘要】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。